Ynternasjonalisaasje, lokalisaasje, kodearring, Yslân en oersetting fan in Japanske kattenfoto-webside

ynternasjonalisaasje oersetting

ynternasjonalisearringD'r is in soad ynformaasje dy't d'r is as it giet om ynternasjonalisaasje, lokalisaasje en kodearring binnen webapplikaasjes. D'r is ek in soad misferstân oer wat elk foar in webapplikaasje leveret. Hjir is myn take ...

As in webbrowser in ferbining makket mei in webserver, passeart hy nochal wat fariabelen en docht ekstra oanfragen, hjir is in foarbyld:

GET / HTTP / 1.1
Host: www.dknewmedia.com
Meidogger-agent: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Akseptearje: HTTP Akseptearje = tekst / xml, applikaasje / xml, applikaasje / xhtml + xml, tekst / html; q = 0.9, tekst / gewoan; q = 0.8, ôfbylding / png, * / *; q = 0.5
Akseptearje-taal: en-us, en; q = 0.5
Akseptearje-kodearring: gzip, deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

ynternasjonalisearring

Ynternasjonalisaasje is in gearstalling fan in protte dingen:

  1. Lokalisaasje: De mooglikheid om te identifisearjen fan hokker taal en lokaasje in besiker besiket. Dit wurdt dien fia HTTP-fersiken wêr't de besiker wurdt identifisearre troch in lokaal. Yn myn gefal is dat en-US. "En" is Ingelsk en "US" is de Feriene Steaten. Dit is in ynstelling yn myn bestjoeringssysteem.
  2. Tiidsônes: De mooglikheid om oan te passen foar tiidsônes. Dit wurdt normaal berikt troch jo server yn te stellen op in Greenwich Mean Time (GMT) en dan brûkers te litten har lokale kompensaasje ynstelle fan GMT.
  3. Karakodearring: Dit is de mooglikheid om taalkaraktersets goed te werjaan. It is oars as lokalisaasje, om't lokalisaasje my de taal en regio fan 'e kompjûter kin fertelle wêr't it fersyk fan docht, mar it sil my net fertelle hokker taal de lêzer freget ... dat is oan de lêzer!

Opmerking yn myn HTTP-koptekst doe't de browser it fersyk die, hy fertelde de server dat hy myn lokaal oanfrege (Akseptearje-taal: en-us); it moat de server lykwols ek fertelle hokker tekenset wurdt frege (Akseptearje-tekenset: akseptearje-karakterset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 en utf -8 binne beide tastiene tekenset.

lokalisaasje

Yn dizze fantastyske mingde wrâld dikteart lokalisaasje taal noait mear. Ek al bin ik yn 'e FS, ik kin in oare taal absolút lêze mei in oare tekenset ... dat is wat der bart as ik brûk Google Hindi (Ik brûk Google Hindi net echt). Myn fersyk foar lokaal en tekenset binne identyk as doe't ik de Google Ingelsk side, mar ik krij eins in pagina dy't ik net kin lêze, om't ik de tekenset net haw. It komt allegear op ???????????… Ik kin lykwols dy tekenset yn Firefox lade (Firefox> Foarkarren> Avansearre> Talen):

Firefox laden taal

As ik dy taal laad, kin ik dan de pagina yn syn eigen karakterset oanfreegje en op myn kompjûter werjaan, hoewol myn standert locale is en-US!

Dat ... as ik in Hindi-studint bin, studearje Ingelsk yn Purdue en ferbûn fia VPN nei de server fan 'e skoalle, op fakânsje yn Austraalje ... binne d'r 3 ferskillende ynstellings dy't moatte wurde tapast op' e applikaasje om wier te ynternasjonalisearjen - en gjin ôfhingje fan 'e oare.

Myn lokaal soe as en-US komme, mar myn tiidsône is Austraalje, mar de taal dy't ik fan 'e webside freegje kin Hindi wêze. As ik myn oanfraach programmearje soe om te meitsjen útgongspunten basearre op 'e lokaal fan myn kompjûter, soe ik folslein ferkeard wêze - de persoan Ingelsk yn in eastlike tiidsône fiede. Ideaal soe ik myn applikaasje programmearje om te bieden beide ynstellings foar taal en tiidsône ... mar ik soe se net oannimme basearre op lokaal.

Yslân - it ultime foarbyld

Wy binne ûnwittend fan meartalige en meardere lokaasjes útdagings yn 'e Feriene Steaten wêr't wy allegearre Ingelsk prate [sarkasme ymplisearre]. Yn guon lannen, lykas Yslân, hoewol de memmetaal Yslânsk is, groeie de ongelooflijke Yslânske minsken 3 talen oan! Om't Yslân in lân is yn 'e midden fan Jeropa en Noard-Amearika, wurkje har bedriuwen yn meardere kontininten, talen, dialekten fan talen en meardere tiidsônes fanôf har buroblêd!

In protte Yslânske websides binne boud yn 't US Ingelsk, UK Ingelsk, Yslânsk, Spaansk, Spaansk, Frânsk en Dútsk! Stel josels foar hoe útdaagjend it soe wêze om te bouwen Icelandair's websiteapplikaasjes en ticketsystemen ... wow!

DISCLAIMER: Ik haw it absolute genot hân om te wurkjen mei de moaie minsken fan Icelandair en kin jo fertelle dat se guon binne fan 'e meast talintearre en freonlike professionals wêr't ik it genoegen mei hie om te wurkjen. It is gewoan in geweldig lân en minsken! Gean besykje ... nim Icelandair en wês wis dat jo de Blue Lagoon!

Taal tsjin kodearring

D'r binne sels ferskillende karakterkodings binnen ien taal dy't net goed mei-inoar spielje! Foarbyld: In Japanske e-post skreaun yn Shift-JIS kin op de kompjûter fan in Japanske persoan ûnlêsber wurde mei lokalisaasje ynsteld op ja-JP, om't har mailserver allinich EUC-JP herkent. Ideaal soe in klant yn steat wêze kinne ynstelle hokker kodearring se wolle en ek hokker taal - gewoan soargje dat de kodearring en taal kompatibel binne mei wat de kliïnt freget.

As ik Japansk wol lêze, moat ik miskien beide Japansk as myn taal EN Shift-JIS selektearje foar kodearjen om dy taal goed wer te jaan. Hjir is wat mear betizing om ta te foegjen oan 'e miks ... guon kodearingssoarten stypje ferskate talen. UNICODE / UTF8 stipet tsientallen. It omkearde is ek wier. Guon talen kinne wurde lêzen yn in protte kodearingssoarten. As dat gjin sin hat ... Ik ferûntskuldigje my, is it in heul kompleks probleem.

Op in dei leau ik (hoopje) dat dit allegear feroaret. Ik tink dat de orizjinele ûntwerpers fan lokalisaasjekoades hope dat de kombinaasje taal-lân alles wêze soe wat nedich is ... mar wy binne folle ferfine wurden. Tink derom, in protte hjirfan waard ûntwikkele foardat in ynternet bestie. Mei de komst fan GIS, faaks kin in persoan har kodearring selektearje en soe GIS tiidzone en lokale ynformaasje behannelje.

ynternasjonalisearring

Werom nei stipe foar ynternasjonalisaasje. As jo ​​in ynternasjonalisearre applikaasje wolle leverje, moatte jo:

  1. Stypje meardere kodearringstypes, talen, en hawwe oersetbestannen om dy oersettingen wer te jaan.
  2. Tastean dat de kliïnt har taal ynstelle, en sels miskien har kodearringstype, as nedich.
  3. Stypje tiidsônes troch brûkers te litten referearje nei har tiidsône yn fergeliking mei GMT.
  4. Brûk lokalisaasjekoades mei foarsichtigens ... se ferbyldzje NET presys wat jo brûker eins freget noch wat se kinne lêze.

Oersetting

Masine-oersetting is noch yn 'e berneskuon. D'r binne in oantal websides (en WordPress plugins) dy't masine-oersetting oanbiede fan jo side. Wês net oanstriid om dit te dwaan ... d'r binne twa redenen wêrom:

  1. As masine-oersetting wurket, hat de brûker dy't jo side kontroleart al in oersetter om mei te wurkjen.
  2. Masine oersetting sûget.

Leau my net? Hjir is in Japanske oersetting foar jo:
Plakt fan Masatsu-bestân - in keardel mei in ton foto's fan katten:

Japanske blogynfier

???????????
- 00:29:35 troch masatsu

??????????????????????????
?????????????????????????

?????????? (?)?

???????????????????????????????????????
?????????????????????????????

??????????????????????????????????? (?)

?????????????????

??????????????
???????????
???????????

???????????????????????????????????

???????????????????????????????

?????????????????????????????????????
?????????????????????????????????
?????????? Ag ??????????????

????????????????????????????????????

Masine-oersetting:

?? Hann ?????
-00: 29: 35 fan masatsu

De namme fan 'e fûsthillige fan in / de oaljefant dy't ferskynde op' e "a / the beast fist fleet ?? fjildwachter ”“ ?? Hann ???? ” mei in / de radio-akteur Yutaka Mizushima….

? (?) dat docht ynktfisken maklik.

Om't sels de radioakteur fan 'e fûsthillige, master ????? fan in / de kat binne de Sineeske kweepeer fan in Nagai Ichiro = draakebal it personiel fan in / de ?? fjildwachter liket op 'e minsken dy't geastige opmerking maklik witte.

?????? (It swit) dat ik dit jier folslein ferjitte "it geheim fan 'e namme fan' e superfloat", fan 'e normale praktyk elk jier?,

?????? As ik dit jier te let skriuw,

??????? hillichdom ??? (kin hoe?)? headland cullion (?? snije net) Fukami ?? (? of observearje kinne?) an / it is it dat docht

?????? Mei wurdt it "a can /? /?", Mei oare wurden, "kung fu", wannear't de kop fan in / de namme opsteld wurdt.

Hoewol it wurdt sein dat it ekstra twa fergrutsje soe, kin it wat foar namme wurde.

De wierheid wurdt sein "leeftyd" te wêzen om't it symboal fan sulveren eleminten Ag? Is, hoewol de namme fan "de ???? sulver ”de Takaoka? technikus fan ??????? tocht dat it personaazje "?" waard brûkt mei de assosjaasje fan in silver'screen? film, as it it neamt mei in tafoegingslid.

?????? Ik tink lykwols egoïstysk, dat myn teory net unrelatearre is dat "?" is opnaam yn in / it Sineeske karakter.

Ik bin der wis fan dat it weromdraaien fan de polariteit op dizze oersetting krekt as lêsbere diksje yn it Ingelsk soe leverje. Jo hawwe de yngong wol begrepen, net?

2 Comments

  1. 1

Wat tinksto?

Dizze side brûkt Akismet om spam te ferleegjen. Learje hoe't jo kommentaargegevens ferwurke wurde.