Alþjóðavæðing, staðfærsla, kóðun, Ísland og þýðing á japönskum kattamyndavef
Það er mikið af upplýsingum þarna úti þegar kemur að alþjóðavæðingu, staðfærslu og kóðun innan vefforrita. Það er líka mikill misskilningur varðandi hvað hver veitir fyrir vefforrit. Hérna tekur ég ...
Þegar vefvafri tengir við netþjóni, þá fer hann með nokkrar breytur og gerir viðbótar beiðnir, hér er dæmi:
FÁ / HTTP / 1.1
Gestgjafi: www.dknewmedia.com
Umboðsmaður notanda: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Samþykkja: HTTP Samþykkja = texti / xml, forrit / xml, forrit / xhtml + xml, texti / html; q = 0.9, texti / látlaus; q = 0.8, mynd / png, * / *; q = 0.5
Samþykkja tungumál: en-us, en; q = 0.5
Samþykkja-kóðun: gzip, losa um loft
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
alþjóðavæðingu
Alþjóðavæðing er samsett úr mörgu:
- Staðsetning: Hæfileikinn til að bera kennsl á frá hvaða tungumáli og staðsetningu gestur heimsækir. Þetta er gert í gegnum HTTP beiðnir þar sem gesturinn er auðkenndur með staðnum. Í mínu tilfelli er það en-US. „En“ er enska og „Bandaríkin“ eru Bandaríkin. Þetta er stilling innan stýrikerfisins míns.
- Tímabelti: Hæfileiki til að aðlagast tímabeltum. Þetta næst venjulega með því að stilla netþjóninn þinn á Greenwich Mean Time (GMT) og leyfa notendum síðan að stilla staðbundna móti frá GMT.
- Persónukóðun: Þetta er hæfileikinn til að sýna tungumálastafasett almennilega. Það er frábrugðið staðfærslu þar sem staðsetning getur sagt mér tungumál og svæði tölvunnar sem beiðnin kemur frá, en það mun ekki segja mér frá hvaða tungumáli lesandi er að biðja um ... það er undir lesandanum komið!
Tilkynning í HTTP hausnum mínum þegar vafrinn kom með beiðnina, hann sagði netþjóninum að hann væri að biðja um landsvæði mitt (Samþykkja-tungumál: en-us); það þarf samt að segja netþjóninum hvaða stafasett er beðið um (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 og utf -8 eru bæði leyfileg stafasett.
Localization
Í þessum frábæra blandaða heimi ræður staðsetning aldrei tungumálinu lengur. Jafnvel þó að ég sé í Bandaríkjunum, þá get ég alveg lesið annað tungumál með öðru stafasetti ... það er það sem gerist þegar ég nota Google hindí (Ég nota í raun ekki Google hindí). Beiðni mín um landsvæði og stafasett er eins og þegar ég bið um Google enska síðu, en mér er reyndar gefið síðu sem ég get ekki lesið vegna þess að ég er ekki með stafasettið. Allt kemur þetta upp ??????????? ... Hins vegar get ég hlaðið því stafasetti í Firefox (Firefox> Valkostir> Ítarlegt> Tungumál):
Ef ég hlaða því tungumáli get ég síðan beðið um síðuna í móðurmáli stafsetningar og birt hana á tölvunni minni þó að sjálfgefið landsvæði mitt sé en-US!
Svo ... ef ég er hindí nemandi, læri ensku í Purdue og tengist í gegnum VPN á netþjóninn í skólanum, í fríi í Ástralíu ... það eru 3 mismunandi stillingar sem þarf að beita á forritið til að verða sannarlega alþjóðavætt - og enginn ráðast af hinu.
Svæðið mitt myndi koma upp sem en-US, en tímabeltið mitt er Ástralía, en tungumálið sem ég bið um frá vefsíðunni kann að vera hindí. Ef ég myndi forrita umsókn mína til að gera forsendur byggt á landsvæði tölvunnar minnar, þá hefði ég algerlega rangt fyrir mér - að fæða viðkomandi ensku í austurlenskri tímabelti. Helst myndi ég forrita umsókn mína til að bjóða bæði tungumál og tímabeltistillingar ... en ég myndi ekki gera ráð fyrir þeim miðað við landsvæði.
Ísland - fullkomna dæmið
Við erum fáfróð um fjöltyngdar og margvíslegar áskoranir í Bandaríkjunum þar sem við allt tala ensku [kaldhæðni gefið í skyn]. Í sumum löndum, svo sem á Íslandi, þó að móðurmálið sé íslenskt, alast ótrúleg íslenska þjóð upp við að læra 3 tungumál! Þar sem Ísland er land í miðri Evrópu og Norður-Ameríku starfa fyrirtæki þeirra um margar heimsálfur, tungumál, tungumál mállýskur og mörg tímabelti frá skjáborðinu!
Margar íslenskar vefsíður eru byggðar á ensku í Bandaríkjunum, ensku í Bretlandi, íslensku, spænsku, spænsku, frönsku og þýsku! Ímyndaðu þér hversu krefjandi það væri að byggja Icelandair's vefumsóknir og miðakerfi ... vá!
Fyrirvari: Ég hef haft algjöra ánægju af því að vinna með fínu fólkinu frá Icelandair og get sagt þér að þeir eru færustu og vinalegustu sérfræðingar sem ég hef haft ánægju af að vinna með. Það er einfaldlega ótrúlegt land og fólk! Farðu í heimsókn ... taktu Icelandair og vertu viss um að heimsækja Blue Lagoon!
Tungumál á móti kóðun
Það eru jafnvel mismunandi stafakóðanir innan eins tungumáls sem spila ekki vel saman. Dæmi: Japanskur tölvupóstur skrifaður í Shift-JIS getur orðið ólesanlegur á tölvu japanskrar manneskju með staðfærslu stillt á ja-JP vegna þess að póstþjónninn þeirra viðurkennir aðeins EUC-JP. Helst ætti viðskiptavinur að geta stillt hvaða kóðun hann vildi og hvaða tungumál - einfaldlega að tryggja að kóðunin og tungumálið samræmdust því sem viðskiptavinurinn er að biðja um.
Ef ég vil lesa japönsku gæti ég þurft að velja bæði japönsku sem tungumál mitt og Shift-JIS til að kóða til að sýna tungumálið rétt. Hér er meira rugl til að bæta við blönduna ... sumar kóðunargerðir styðja nokkur tungumál. UNICODE / UTF8 styður tugi. Hið gagnstæða er líka rétt. Sum tungumál er hægt að lesa í mörgum tegundum kóðunar. Ef það er ekki skynsamlegt ... Ég biðst afsökunar, það er mjög flókið mál.
Einhvern tíma trúi ég (vona) að þetta muni allt breytast. Ég held að upphaflegir hönnuðir staðsetningarkóða hafi vonað að tungumálalöndin væru allt sem þarf ... en við erum orðin miklu flóknari. Mundu að margt af þessu var þróað áður en internet var til. Með tilkomu GIS, kannski getur maður valið kóðun sína og GIS myndi sjá um tímabelti og staðsetningarupplýsingar.
alþjóðavæðingu
Aftur að stuðningi við alþjóðavæðingu. Ef þú vilt leggja fram alþjóðlegt forrit þarftu að:
- Styðja margar kóðunargerðir, tungumál og hafa þýðingaskrár til að birta þessar þýðingar.
- Leyfðu viðskiptavininum að stilla tungumál sitt, og jafnvel kóðunargerðina, ef nauðsyn krefur.
- Styðjið tímabelti með því að leyfa notendum að vísa á tímabeltið í samanburði við GMT.
- Notaðu staðfærslukóða með varúð ... þeir sýna EKKI nákvæmlega það sem notandi þinn er raunverulega að biðja um né hvað þeir geta lesið.
Þýðing
Vélþýðing er enn á byrjunarstigi. Það eru fjöldi vefsíðna þarna úti (og WordPress Plugins) sem bjóða upp á vélþýðingu á síðunni þinni. Ekki freistast til að gera þetta ... það eru tvær ástæður fyrir því:
- Ef vélþýðing virkar mun notandinn sem er að skoða síðuna þína þegar hafa þýðanda til að vinna með.
- Vélþýðing sýgur.
Ekki trúa mér? Hérna er japönsk þýðing fyrir þig:
Límt frá Masatsu skjal - náungi með mikið af myndum af köttum:
Japönsk bloggfærsla
????
- 00:29:35 eftir masatsu??????????????????????????
???????????????????????????????????? (?)?
????????????????????????????????????????
???????????????????????????????????????????????????????????????? (?)
Útdráttur
??????????????
????
?????????????????????????????????????
???????????????????????????????
?????????????????????????????????????
?????????????????????????????????
??????????? Ag ?????????????????????????????????????????????????????
Vélþýðing:
?? Hann ?????
-00: 29: 35 eftir masatsuNafn hnefadýrkanda / fílsins sem birtist á „a / the deast fist flota ?? landvörður ““ ?? Hann ???? ” með / útvarpsleikaranum Yutaka Mizushima….
? (?) það gerir skötusel auðveldlega.
Vegna þess að jafnvel útvarpsleikari hnefaleikans, meistari ????? af / köttinum eru kínverskir kviðnar af Nagai Ichiro = drekakúla stafurinn af a / the ?? landvörður lítur út eins og fólkið sem hnyttin athugasemd veit fúslega.
?????? (svitinn) sem ég var að gleyma alveg þetta árið “leyndarmálið á nafni ofurflotans”, venjulegum venjum á hverju ári?,
?????? Ef ég skrifa seint á þessu ári,
??????? helgidómur ??? (getur hvernig?)? nesadýr (?? skera ekki) Fukami ?? (? eða fylgjast með færum?) er það / sem gerir það
?????? Með verður það „dós /? /?“, Með öðrum orðum „kung fu“, þegar stillt er upp og skipt um höfuð á / nafninu.
?????? Þó að það sé sagt að auki tvö til viðbótar að sögn gæti það orðið hvers konar nafn.
Sannleikurinn er sagður vera „aldur“ vegna þess að silfurþáttatáknið er Ag?, Þó að nafnið „the ???? silfur ”Takaoka? tæknimaður ??????? var að hugsa um að persónan kallaði “?” var notað með samtökum silfurskjá? kvikmyndar, ef það kallar það með viðbótarmanni.
?????? Ég er hins vegar að hugsa eigingirni, að kenning mín sé ekki ótengd að “?” er innifalinn í / kínverska stafnum.
Ég er viss um að það að snúa við póluninni við þessa þýðingu myndi veita jafn læsilegan orðasamband á ensku. Þú skildir innganginn, ekki satt?