Te "krzaczki" to znacznik BOM. Czyli musisz sprawdzić, czy nie ma go na początku danych, i jeśli jest, to wtedy pominąć te parę bajtów. Nie zakładaj, że ten znacznik będzie tam zawsze i zawsze będzie miał tę samą wartość (choć nie wyobrażam sobie, żeby było tam inne kodowanie niż utf-8 - nie ma racjonalnych przesłanek).
C++ Reference - opis wszystkich klas STL-a i funkcji C.