Site hosted by Angelfire.com: Build your free website today!
UTF-8 Test

UTF-8 can, with the appropriate fonts applied, display a mixture of characters that are incompatible under local encodings (ISO-8859-1, ISO-8859-2, ISO-8859-3 ... Windows-1251, Shift-JIS, BIG5 ...). For a very useful page about Unicode fonts, their downloadability, what Unicode ranges are covered by what fonts ... , click here.

The following is presented twice, first with font-face set to Arial Unicode MS, and then with font face unset.
 
 

FONT-FACE SET TO ARIAL UNICODE MS

W. European (German, French, Norwegian, Irish):
... den beiden Weltkriegen zu erklären und die sie als unumstößlich betrachten wird.
Il vise à faire taire des gens qui auraient, paraît-il, affirmé qu'un système ...
Høgnorsk? Flatnorsk? Kva for eit språk for Noreg?
Mion-chànain na h-Eòrpa

C. European (Polish, Czech):
Zostałem anarchistą już jako nastolatek, kiedy tylko zacząłem poważniej myśleć o świecie.
Postavmme proti mezinárodnímu svazu buržoasii, rostoucí svaz internacionalistických proletářu!

Turkish:
Bu amaçla, çeşitli milliyetlerden komünistler, Londra'da toplanmışlar ve İngiliz, Fransız, Alman, İtalyan, Flemenk ve Danimarka dillerinde yayınlanmak üzere, aşağıdaki Manifestoyu kaleme almışlardır.

Esperanto:
Preskaŭ freŝa ĉeĥa manĝaĵo troveblis tiam.

Russian:
Кропоткин  и  Бордига

International Phonetic Alphabet:
ə  ɔ  ɛ  æ  ɑ  ɒ  ʌ  ɯ  ʐ  ʑ  ɕ  ʃ   ʒ   ʂ  ʁ  ɹ  ʅ  ɿ  ɻ  ʈ   ŋ  dʰ   d̥

Maltese:
Fl-1995 għall-ewwel darba ġew koperti l-ispejjeż kollha li kienet tagħmel il-YTC sabiex ittella' l-festival.

Thai:
ฉันกินกระจกได้ แต่มันไม่ทำให้ฉันเจ็บ

Vietnamese:
Hội Đồng Bảo An Liên Hiệp Quốc. (「會董  保安  聯合國」= 聯合國安理會)

Arabic:
ِكيَلَع يـفرَطٌدـِساَح يِّلُكـَف

Hindi:
मैं  काँच  खा  सकता  हूँ,  मुझे  उस  से  कोई  पीडा  नहीं  होती.

Tamil:
நான்  இந்த  பக்கத்தை  செய்ய  விரும்பவில்லை.

Dungan:
«Җеёди Хуэйзў-Вурус Хуадян» дэ «Хуэйзў Йүянди Лэйүан Хуадян»
дусы Хырхызстан Куәщүә Академия Хуэйзў Вынмин Секторди фу.

Hanyu Pinyin:
Zhào Yuánrèn: "Tōngzì Fāng'àn", Bĕijīng: Shāngwù Yìnshūguăn, 1983

Uyghur (Yengi Yeziq):
Uyƣurqə biləmsiz?

Hangŭl:
나는  유리를  먹을  수  있어요.

Hanzi/Kanji/Hanja:
發賣中 (pre-reform)
発売中 (Japan)
发卖中 (China)

xan¹¹tɕiɛn⁵³  tʂu⁵³in⁵⁵  fu¹³xau⁵³ :
万 兀 广 帀  ( = v  ŋ  ɲ  ɿ + ʅ  )

a e i o u  A E I O U with various diacritics:
with macron:       ā ē ī ō ū     Ā Ē Ī Ō Ū
with acute:           á é í ó ú     Á É Í Ó Ú
with grave:           à è ì ò ù     À È Ì Ò Ù
with caron:           ǎ ě ǐ ǒ ǔ     Ǎ Ě Ǐ Ǒ Ǔ
with breve:           ă ĕ ĭ ŏ ŭ     Ă Ĕ Ĭ Ŏ Ŭ 
with tilde:              ã ẽ ĩ õ ũ     Ã Ẽ Ĩ Õ Ũ
with circumflex:   â ê î ô û     Â Ê Î Ô Û
with diaeresis:     ä ë ï ö ü     Ä Ë Ï Ö Ü
with ogonek:        ą ę į ǫ ų     Ą Ę Į Ǫ Ų
u diaeresis plus:  ǜ ǘ ǚ ǜ       Ǜ Ǘ Ǚ Ǜ

 UNSET FONT-FACE

W. European (German, French, Norwegian, Irish):
... den beiden Weltkriegen zu erklären und die sie als unumstößlich betrachten wird.
Il vise à faire taire des gens qui auraient, paraît-il, affirmé qu'un système ...
Høgnorsk? Flatnorsk? Kva for eit språk for Noreg?
Mion-chànain na h-Eòrpa

C. European (Polish, Czech):
Zostałem anarchistą już jako nastolatek, kiedy tylko zacząłem poważniej myśleć o świecie.
Postavmme proti mezinárodnímu svazu buržoasii, rostoucí svaz internacionalistických proletářu!

Turkish:
Bu amaçla, çeşitli milliyetlerden komünistler, Londra'da toplanmışlar ve İngiliz, Fransız, Alman, İtalyan, Flemenk ve Danimarka dillerinde yayınlanmak üzere, aşağıdaki Manifestoyu kaleme almışlardır.

Esperanto:
Preskaŭ freŝa ĉeĥa manĝaĵo troveblis tiam.

Russian:
Кропоткин  и  Бордига

International Phonetic Alphabet:
ə  ɔ  ɛ  æ  ɑ  ɒ  ʌ  ɯ  ʐ  ʑ  ɕ  ʃ   ʒ   ʂ  ʁ  ɹ  ʅ  ɿ  ɻ  ʈ   ŋ  dʰ   d̥

Maltese:
Fl-1995 għall-ewwel darba ġew koperti l-ispejjeż kollha li kienet tagħmel il-YTC sabiex ittella' l-festival.

Thai:
ฉันกินกระจกได้ แต่มันไม่ทำให้ฉันเจ็บ

Vietnamese:
Hội Đồng Bảo An Liên Hiệp Quốc. (「會董  保安  聯合國」= 聯合國安理會)

Arabic:
ِكيَلَع يـفرَطٌدـِساَح يِّلُكـَف

Hindi:
मैं  काँच  खा  सकता  हूँ,  मुझे  उस  से  कोई  पीडा  नहीं  होती.

Tamil:
நான்  இந்த  பக்கத்தை  செய்ய  விரும்பவில்லை.

Dungan:
«Җеёди Хуэйзў-Вурус Хуадян» дэ «Хуэйзў Йүянди Лэйүан Хуадян»
дусы Хырхызстан Куәщүә Академия Хуэйзў Вынмин Секторди фу.

Hanyu Pinyin:
Zhào Yuánrèn: "Tōngzì Fāng'àn", Bĕijīng: Shāngwù Yìnshūguăn, 1983

Uyghur (Yengi Yeziq):
Uyƣurqə biləmsiz?

Hangŭl:
나는  유리를  먹을  수  있어요.

Hanzi/Kanji/Hanja:
發賣中 (pre-reform)
発売中 (Japan)
发卖中 (China)

xan¹¹tɕiɛn⁵³  tʂu⁵³in⁵⁵  fu¹³xau⁵³ :
万 兀 广 帀  ( = v  ŋ  ɲ  ɿ + ʅ  )

a e i o u  A E I O U with various diacritics:
with macron:       ā ē ī ō ū     Ā Ē Ī Ō Ū
with acute:           á é í ó ú     Á É Í Ó Ú
with grave:           à è ì ò ù     À È Ì Ò Ù
with caron:           ǎ ě ǐ ǒ ǔ     Ǎ Ě Ǐ Ǒ Ǔ
with breve:           ă ĕ ĭ ŏ ŭ     Ă Ĕ Ĭ Ŏ Ŭ 
with tilde:              ã ẽ ĩ õ ũ     Ã Ẽ Ĩ Õ Ũ
with circumflex:   â ê î ô û     Â Ê Î Ô Û
with diaeresis:     ä ë ï ö ü     Ä Ë Ï Ö Ü
with ogonek:        ą ę į ǫ ų     Ą Ę Į Ǫ Ų
u diaeresis plus:  ǜ ǘ ǚ ǜ       Ǜ Ǘ Ǚ Ǜ

 


For a UTF-8 test page of more limited scope but with gif. images, click here.

TO INDEX