Zašto Kinezi pišu bez razmaka između riječi? Zanimljive činjenice o kineskom jeziku. Upareni tip slova

Prednosti uvođenja razmaka pri pisanju kineskog

1. Poboljšava čitljivost: Dodavanje granica riječi smanjuje kognitivno opterećenje pri čitanju kineskog teksta. Ako je tekst napisan bez razmaka, čitatelj treba analizirati gdje riječi počinju i gdje završavaju, dok istovremeno pokušava shvatiti značenje teksta, čime se komplicira ionako težak zadatak.

2. Točnija strojna obrada tekstova napisanih na kineskom: Prije nego što takva obrada kineskog teksta može započeti, tekst se prvo mora segmentirati. Ovo nije lak zadatak pri obradi jezika koji koriste hijeroglifsko pismo. Postoje brze strojne metode koje nisu baš precizne (~90%), a postoje spore metode koje su preciznije (~94-97%), ali nijedna metoda nije savršena.
Kad bi kinesko pismo imalo razmake između riječi, ne bi bilo potrebe za segmentacijom, a strojna obrada kineskog teksta postala bi mnogo lakša. Kao rezultat toga, zadatak prevođenja s kineskog bit će znatno pojednostavljen.

3. Olakšavanje učenja kineskog za učenike: razmaci između riječi čine riječi i rečenice lakšim za razumijevanje. Kad sam tek počeo učiti kineski, proveo sam puno vremena tražeći riječi koje nisu postojale u rječniku jer je nedostatak razmaka između riječi otežavao razumijevanje granica riječi na kineskom. Uvođenje razmaka između riječi omogućilo bi učenicima kineskog jezika da brže i učinkovitije izgrade vokabular.

Zašto kineski tekst ne treba razmake između riječi?

1. Što je riječ? Koncept "riječi" u kineskom je prilično nejasan. Gdje počinje i gdje završava riječ? Jednostavno pitanje za izvornog govornika ruskog (i bilo kojeg drugog jezika koji se temelji na abecedi) može zbuniti izvornog govornika kineskog. Na primjer, treba li se čestica 了, koja označava prošlo vrijeme, smatrati dijelom riječi?
Na primjer, u rečenici 小刘来了 gdje staviti razmak - 小刘_来了 ili 小刘来_了?Za same govornike kineskog, koji nisu navikli čitati tekstove s razmacima između riječi, uvođenje razmaka samo će zakomplicirati razumijevanje pisanog jezika.

2. Tradicija: Kinesko pismo postoji više od 3000 godina i tijekom tog vremena razmaci između riječi nisu uvođeni. Zašto ih sada uvoditi?

3. Kineski tekst izgleda ljepše bez razmaka između riječi. Uvođenje razmaka olakšalo bi razumijevanje kineskog učenika, ali nitko ne bi prilagođavao jezični sustav za one koji ga tek uče.

p.s. 1. Drevni europski tekstovi također nisu imali razmake između riječi.

p.s. 2: U ruskom jeziku potrebni su razmaci jer se bez njih značenje izjave mijenja.
Usporedi: Apsurdne_stvari i Nošenje_različitih_stvari.

p.s. 3.: Ruski govornik savršeno razumije i ako je napisan bez razmaka, u početku ga je teško razumjeti, ali onda se naš mozak prilagodi...

Svatko tko je radio na projektu iz Kine ili tamo pokrenuo kampanju zna da je domaća ideja dizajna drugačija od one zapadne. Ne morate daleko tražiti primjere - ako radite za međunarodnu robnu marku u Kini ili stvarate proizvod koji se tamo prodaje, pogledajte na Baidu.com ili QQ.com kako biste vidjeli kako je vaša marka predstavljena na kineskom online prostor.

Najveća razlika je u tome što njihove stranice izgledaju vrlo pretrpano. Puno teksta, poveznica, pa čak i animacija koje izgledaju osmišljene kako bi stranicu učinile nečitljivom.

Možda izgleda kao digitalni kaos, ali kineske su web stranice tako dizajnirane iz nekoliko razloga. Ako planirate pokrenuti svoju tvrtku u Kini, savjetujemo vam da naučite neke značajke lokalnog web iskustva.

Kineski jezik je potpuno drugačiji

Prvo, evo nekoliko činjenica koje biste trebali znati:

1. U kineskom nema velikih slova. Zapadni čitatelji obučeni su prepoznavati velika slova u tekstu kako bi pronašli početak i kraj rečenice. Zbog toga kineske stranice mogu izgledati kao skup sličnih znakova

2. Nema razmaka između znakova. Zapadni jezici koriste razmak za odvajanje riječi, nešto što ni kineski ne radi. Ovdje je dugačak niz znakova sasvim normalan, dok je za zapadnjačke korisnike zbunjujući

3. Jeste li napravili malo tijesta? U principu, sve je jasno, zar ne? Riječi s obrnutim slovima lako se čitaju sve dok su prvo i zadnje slovo na pravom mjestu i sve dok nisu napisane potpuno unatrag. Zbog toga ljudi pogledom prelaze preko teksta umjesto da čitaju svaku riječ. No budući da ne mogu preletjeti kineske tekstove na isti način (pod pretpostavkom da su im znakovi nepoznati), retke takvih znakova čine im se posebno kaotičnim.

4. Kineski znakovi mnogo su “gušći” od latiničnih ili ćiriličnih slova - 10 poteza u jednom znaku u prosjeku naspram jednog ili dva. Zbog toga, opet, kineski tekst zapadnom korisniku izgleda "preopterećeno".

Sljedeća zbunjujuća karakteristika je da tipična kineska web stranica izgleda kao jedna velika poveznica. Na Sohu.com doslovno je svaki znak dio veze.

O tome postoje dvije teorije. Prvi je taj što je kineske znakove teško upisivati ​​na abecednoj tipkovnici, pa umjesto da koriste okvir za pretraživanje, korisnici obično klikaju na poveznice.

To je sasvim razumno budući da upisivanje kineskih znakova uključuje ili crtanje znakova ili korištenje zapadnih slova za transkripciju pinyina.

Nakon što je hijeroglif napisan ili njegova transkripcija ispisana, pojavljuju se opcije za simbole među kojima korisnik mora odabrati ispravan. Čini se da je to stalno ponavljanje pretraživanja prilično teško.

Ali postoji još jedna teorija. A s obzirom na popularnost tražilice Baidu, koja nudi kineski ekvivalent Google pretraživanja, ima razloga vjerovati u to. Prema ovoj teoriji, mnogi Kinezi još uvijek koriste internet niske brzine. A statistike iz Akamaijeve studije to potvrđuju.

Postotak online populacije ovisno o zemlji i brzini interneta: ispod 4 MB/s, iznad 4 MB/s, ispod 10 MB/s, iznad 10 MB/s

Kao što možete vidjeti, dvije trećine Kineza koristi internet s brzinama veze ispod 4 Mbps - to je znatno niže od globalne prosječne brzine i gotovo nečuveno u zapadnim zemljama.

Zaključak, s tako relativno sporim brzinama interneta, ima smisla učitati jednu stranicu s puno poveznica i zatim ih otvoriti u novim karticama. Ovo korisnicima omogućuje paralelno pregledavanje stranica, umjesto bolno dugog učitavanja stranice jednu po jednu. Oni koji se sjećaju dial-up internetskih veza shvatit će o čemu govorimo.

Konačno, kineske web stranice koriste mnogo bljeskajućeg teksta i natpisa.

Čini se da je razlog tome što je puno teže privući pozornost korištenjem različitih fontova u kineskom nego u zapadnim tekstovima. Postoji niz razloga za to, uključujući:

1. Postoji samo nekoliko fontova za kineska slova.
2. Kurziv ne postoji i podebljavanje se obično ne koristi.
3. Minimalna veličina fonta - 12 piksela

Štoviše (i ovdje se okrećemo kulturnoj komponenti), čini se da je Kinezima jednostavno manje stalo do blještave grafike nego Zapadnjacima. Kao rezultat toga, ono što se nama čini preopterećenim za njih je normalno.

Osim toga, s pojavom skočnih prozora na zapadnim stranicama, kineski resursi više ne izgledaju toliko različiti od njih kao što su nekada izgledali.

U zaključku

Interpunkcijski znakovi sastavni su dio svakog jezika. Običan zarez može radikalno promijeniti značenje rečenice: samo se sjetite priče o "Pogubljenje se ne može oprostiti." A posao prevoditelja i urednika zahtijeva da tečno vladaju barem dvama interpunkcijskim sustavima.

Ideja za ovaj post rodila se dok smo razgovarali o prijevodu jednog članka. U izvornom materijalu znak postotka bio je odvojen razmakom od broja i to mi je zapelo za oko - u ruskom tekstu u ovom slučaju razmak se ne koristi (iako je izjava još uvijek kontroverzna - stručnjaci nisu došli do konsenzus o ovom pitanju). Onda smo odlučili da moramo razgovarati o tome. Stručnjaci Odjela za višejezičnu lokalizaciju intervjuirali su naše strane kolege i pripremili materijal koji sada dijelimo s vama. Nadamo se da će vam biti od koristi.

Na početku i na kraju

Pogledajmo kako stoje stvari s postavljanjem interpunkcijskih znakova u rečenici: točke, zarezi, dvotočke, točke i zarezi, upitnici i uskličnici.

Nadamo se da se svi sjećaju ruskog jezika - interpunkcijski znakovi koji razdvajaju rečenice jedni od drugih stavljaju se samo na kraju, točka. Ako trebate dodati izraz (osobito u osobnoj korespondenciji), koriste se kombinacije znakova - "!!!", "?!" i slično. Na engleskom, njemačkom, talijanskom, francusko-kanadskom, arapskom i brazilskom portugalskom, točke, elipse i njihovi "drugovi" slijede ista pravila.

Ostala pravila na francuskom: dvotočkama, točkama i zarezima, uskličnicima i upitnicima prethode neprekinuti razmaci.

Španjolski je jedini jezik u našem izboru u kojem interpunkcijski znakovi uokviruju rečenice: na početku fraze, upitnici i uskličnici se dupliciraju u "malo" obrnutom obliku - "¿" i "¡".

Kinezi imaju najneobičniji pristup interpunkcijskim znakovima s europskog gledišta. Njihova točka izgleda kao 。, zarez kao ,, uskličnik kao !, a upitnik kao ?. U rečenici se ponašaju kao njihovi ruski kolege, jedina razlika je u tome što Kinezi ne koriste razmake, jer su svi interpunkcijski znakovi dvobajtni. Hijeroglif upisan na tipkovnici dvostruko je širi od bilo kojeg slova latinične abecede. Stoga interpunkcijski znakovi obično zauzimaju isti prostor kao i hijeroglif. S ovom su se značajkom susreli oni koji su radili u starim IME-ovima koji su pokretali DOS, kada je neispravno uneseni hijeroglif uklonjen dvaput pritiskom na Backspace. Razmaci se uglavnom koriste za odvajanje riječi i znakova iz drugih jezika, poput engleskog.

Slatke osobine

U ruskom se koristi ili crtica ili crtica. Crtica je kratka i neophodna je za prijenos i povezivanje složenica. Crtica je znatno duža; služi za razdvajanje semantičkih dijelova: različitih rečenica, dva dijela jedne rečenice, u dijalozima i sl. Možete se sjetiti svih suptilnosti korištenja ovih znakova gledajući udžbenik ruskog jezika.

Crtice i crtice postoje pod sličnim uvjetima u engleskom, njemačkom, francuskom i brazilskom portugalskom. Štoviše, u američkom engleskom crtica je s obje strane odvojena razmacima, ali u britanskom engleskom obično nije:

Predavanje – koje je treće na ovu temu ovog mjeseca – uključivat će govornike iz različitih zemalja. (američki engleski)

U zoološkom je vrtu bilo jako puno mačaka - lavova, pantera, tigrova, jaguara i geparda - što je otežavalo odabir omiljene. (britanski engleski)

Na španjolskom, talijanskom i arapskom crtice i crtice izgledaju isto: "-". Kinezi uopće ne koriste crtice - imaju samo crtice. Iako pored slova latinične abecede mogu biti crtice, duge crtice i srednje crtice. Crtica je kratka i neophodna je za prijenos i povezivanje složenica. Crtica je znatno duža; služi za odvajanje semantičkih dijelova

jezici Crtica Em crtica (Alt 0151)
ruski
engleski američkiDa, za rastavljanje crtica i spajanje složenicaDa, za odvajanje semantičkih dijelova: različite rečenice, dva dijela jedne rečenice, u dijalozima itd.
engleski
britanski
Da, za rastavljanje crtica i spajanje složenicaDa, za odvajanje semantičkih dijelova: različite rečenice, dva dijela jedne rečenice, u dijalozima itd. Nije odvojen razmacima s obje strane.
njemačkiDa, za rastavljanje crtica i spajanje složenicaDa, za odvajanje semantičkih dijelova: različite rečenice, dva dijela jedne rečenice, u dijalozima itd.
francuskiDa, za rastavljanje crtica i spajanje složenicaDa, za odvajanje semantičkih dijelova: različite rečenice, dva dijela jedne rečenice, u dijalozima itd.
francuski kanadskiDa, za rastavljanje crtica i spajanje složenicaDa, za odvajanje semantičkih dijelova: različite rečenice, dva dijela jedne rečenice, u dijalozima itd.
španjolskiDa, u svim slučajevima-
portugalski
brazilski
Da, za rastavljanje crtica i spajanje složenicaDa, za odvajanje semantičkih dijelova: različite rečenice, dva dijela jedne rečenice, u dijalozima itd.
talijanskiDa, u svim slučajevima-
arapskiDa, u svim slučajevima-
kineskiSamo pored slova iz latiniceDa, u svim slučajevima
Upareni tip slova


Navodnici postoje u svim jezicima, ali, kao i narodne nošnje, izgledaju drugačije. U ruskom jeziku postoje i tradicionalna "božićna drvca", koja dolaze iz francuskog, i njemačke "šape", koje se koriste u frazama unutar navodnika i pri pisanju rukom. Španjolski, brazilski portugalski, talijanski i arapski koriste dvostruke navodnike.

Englezi koriste 'jednostruke' i 'dvostruke' navodnike: prvi za naslove, drugi za navodnike. Točke i zarezi su unutar navodnika. U francuskom tekstu postoje "riblja kost", s jednom razlikom od ruskog: postoji kontinuirani razmak između početka citiranog teksta i otvorenog navodnika, kao i između kraja fraze i zatvarajućeg navodnika.

Postoje tri vrste navodnika u kineskom jeziku, koji služe različitim svrhama. To su nazivi knjiga, filmova i drugih autorskih djela. Za sve ostale slučajeve, Kinezi koriste 「takav」. Navodnici iz europske tradicije (bilo “božićna drvca”, “šape”, “jednostruki” ili “dvostruki”) mogu se naći samo u prijevodima ili u kombinaciji s frazama iz europskih jezika. Nisu stekli popularnost u tradicionalnom kineskom jeziku.

Navodnici postoje u svim jezicima, ali, kao i narodne nošnje, izgledaju drugačije.

jezici«…» „…“ “…” ‘…’ 《…》 「…」
ruskiStandard, točke i zarezi izvanaAlternative u frazi unutar navodnika i pri pisanju rukomAlternative kod pisanja rukom- - -
engleski
američki
- - Standard za naslove- -
engleski
britanski
- - Standardno kod citiranja, točke i zarezi unutraStandard za naslove- -
njemački- Standard- - - -
francuskiStandardni razmak bez prekida prije otvaranja i zatvaranja kotacija- - - - -
španjolski- - Standard- - -
portugalski
brazilski
- - Standard- - -
talijanski- - Standard- - -
arapski- - Standard- - -
kineskiSamo u prijevodima ili u kombinaciji s izrazima iz europskih jezikaSamo u prijevodima ili u kombinaciji s izrazima iz europskih jezikaSamo u prijevodima ili u kombinaciji s izrazima iz europskih jezikaStandard za naslove knjiga, filmova i drugih autorskih djelaStandardno za ostale slučajeve
Simbolizam

Postoci i ppm također nisu osobito standardni. Na njemačkom, francuskom i španjolskom ovi znakovi moraju biti odvojeni neprekinutim razmacima. A na ruskom, engleskom, talijanskom, arapskom i brazilskom portugalskom pišite odmah nakon broja. Iako je s Rusima, kao što se sjećamo, situacija dvosmislena.

Stupnjevi i inči obično se stavljaju iza broja bez razmaka.

Zabavna činjenica: kad Francuzi pišu velike brojeve, blokove od tri znamenke odvajaju razmacima - na primjer: 987,654,321.12.

Kinezi imaju svoje znakove za stupnjeve (度) i postotke (百分比 i 百分之). Međutim, uz njih se koriste uobičajeni ° i % bez razmaka ispred njih.

Uspostavljanje dijaloga

Oblikovanje dijaloga također se razlikuje od jezika do jezika. U ruskom jeziku stavljamo crticu em ispred svakog retka. Govornici brazilskog portugalskog čine isto.

Na engleskom se koriste "dvostruki" i "jednostruki" navodnici, na primjer:

'Ovdje je milijun funti', rekla je Marina, pružajući Simonu kovčeg.

Marina je nastavila: 'Razgovarala sam s Ivanom i rekao je 'Simon traži deset milijuna, ali to je previše'.

Na njemačkom su dijalozi također oblikovani pomoću tradicionalnih navodnika - "šape". Francuzi stavljaju "riblje kosti", kao i kratke crtice, u slučajevima kada se mijenja autor retka. Dijelovi dijaloga su isprekidani crticama i na španjolskom.

Talijanski i arapski koriste dvostruke ravne navodnike za dijalog.

Kinezi obično samo stavljaju 「navodnike」 ili njihov engleski ekvivalent u svoj dijalog.

Velika ili mala


Na engleskom, francuskom, španjolskom, portugalskom, brazilskom i talijanskom sve je jednostavno i poznato govornicima ruskog - velika slova koriste se na početku rečenica, za kratice i vlastita imena.

Njemački je mnogo zabavniji. Imenice, imena i titule, učtivi oblik obraćanja (Sie) u svim padežnim oblicima (Ihr, Ihre, Ihrer, Ihres, Ihrem, Ihren) pišu se velikim slovom. Pridjevi, participi i infinitiv koji se u rečenici koriste kao imenice u kombinaciji s određenim (das Gute) ili neodređenim (ein Lächeln) članom, prijedlogom (in Blau), zamjenicom (dein Stottern), brojem (nichts Aufregendes) ili pridjevom u sklonjeni oblik (lautes Sprechen). Baš sve :-)

Arapska abeceda ne pravi razliku između malih i velikih slova, ali većina slova ima dva, tri ili četiri različita načina pisanja: za početak, sredinu i kraj riječi, a ponekad i za jedno slovo izvan riječi. Slična se situacija razvila u kineskom jeziku - malo je vjerojatno da će biti moguće razlikovati mala ili velika slova. A ako kineski autori trebaju istaknuti neki dio teksta, onda ga podvlače ili koriste podebljano.

16

Želio bih omogućiti da MySQL pretraživanje cijelog teksta radi s japanskim i kineskim tekstom, kao i bilo kojim drugim jezikom. Problem je u tome što ovi jezici, a možda i drugi, obično nemaju razmak između riječi. Pretraživanje nije korisno kada morate unijeti istu rečenicu kao u tekstu.

Ne mogu samo staviti razmak između svakog znaka jer i engleski mora funkcionirati. Želio bih riješiti ovaj problem s PHP-om ili MySQL-om.

Mogu li konfigurirati MySQL da prepozna znakove koji bi trebali biti njihovi vlastiti indeksi? Postoji li PHP modul koji može prepoznati te znakove tako da mogu jednostavno izbaciti razmake oko indeksa?

Djelomično rješenje:

$string_with_spaces = preg_replace("/[".json_decode(""\u4e00"")."-".json_decode(""\uface"")."]/", " $0 ", $string_without_spaces);

Ovo čini klasu karaktera od barem nekih likova koje trebam posebno tretirati. Vjerojatno bih trebao spomenuti da je prihvatljivo preskočiti indeksirani tekst.

Zna li netko sve raspone znakova koje ću morati umetnuti u sondu?

Također, mora postojati bolji, prenosivi način predstavljanja ovih znakova u PHP-u? Izvorni kod u Literal Unicodeu nije savršen; Ne prepoznajem sve likove; možda se neće pojaviti na svim strojevima koje trebam koristiti.

3

Ostali moderni jezici koji ne koriste razmake između riječi su tajlandski, laoski, kmerski (kambodžanski) i burmanski (mianmarski). U vijetnamskom postoji problem s tim da se razmaci koriste između svih slogova osim stranih riječi. - hippietrail 18. prosinca 10 2010-12-18 12:48:10

  • 2 odgovora
  • Sortiranje:

    Aktivnost

15

Kršenje riječi za navedene jezike zahtijeva lingvistički pristup , na primjer onaj koji koristi rječnik uz razumijevanje osnovnih pravila koja proizlaze.

Čuo sam za relativno uspješne aplikacije za pretraživanje cijelog teksta koje jednostavno odvajaju svaki pojedinačni znak kao zasebnu riječ na kineskom, jednostavno primjenjujući istu "tokenizaciju" kriterija pretraživanja koje pružaju krajnji korisnici. Tražilica zatim daje bolje rangiranje za dokumente koji sadrže znakove riječi istim redoslijedom kao i kriteriji pretraživanja. Nisam siguran može li se to proširiti na jezike kao što je japanski, budući da hirakana i katagana skupovi znakova čine tekst sličnijim europskim jezicima s kratkom abecedom.

UREDI:
Resursi
Ova riječ je za rastavljanje problema, kao i povezanih pitanja, tako netrivijalan da su o tome napisane cijele knjige. Pogledajte na primjer CJKV obrada informacija (CJKV je kratica za kineski, japanski, korejski i vijetnamski, također možete koristiti ključnu riječ CJK jer mnogi tekstovi ne govore o vijetnamskom). Vidi također Razbijanje riječi na japanskom je teško za jednog pagera na ovu temu.
Jasno je da je većina materijala koji pokriva ovu temu napisana na jednom od glavnih jezika u materinskom jeziku i stoga je ograničena na ljude bez relativnog znanja tih jezika. Iz tog razloga i kako bismo vam pomogli u testiranju tražilice, nakon što počnete implementirati logiku rastavljanja riječi, trebali biste potražiti pomoć od jednog ili dva izvorna govornika.

Razne ideje
Vaša ideja identificiranje značajki koje sustavno podrazumijevaju prijelom riječi(recimo navodnici, zagrade, simboli poput crtice i slično) su dobri, a ovo je vjerojatno jedna heuristika koju koriste neki od profesionalnih rastavljača riječi. Međutim, trebali biste potražiti ugledan izvor za takav popis umjesto da ga sastavljate od nule na temelju anegdotskih otkrića.
Srodna ideja je rastavljanje riječi Kana-kanji prijelazi(ali pretpostavljam da nije obrnuto), a možda i u hiragana-kakatana ili obrnuto prijelazi.
Bez veze s neispravnim, indeks može [-ili ne mora- ;-)] imati koristi od sustavnog pretvaranja svakog, recimo, hiragana znaka u odgovarajući katakana znak. Samo neobrazovana ideja! Ne znam dovoljno o japanskom da znam hoće li ovo pomoći; intuitivno, to bi bilo labavo povezano sa sustavnom pretvorbom naglašenih slova i stoga u odgovarajuće nenaglašeno pismo, kao što se prakticira u nekoliko europskih jezika.

Možda bi se ideja koju sam ranije spomenuo o sustavnom indeksiranju pojedinačnih znakova (i rangiranju rezultata pretraživanja na temelju njihove aproksimacije pojmu pretraživanja) mogla malo modificirati, na primjer držanjem uzastopnih kana znakova zajedno, a zatim nekim drugim pravilima... i stvaranjem nesavršenih, ali sasvim praktična tražilica.

Nemojte biti razočarani ako to nije slučaj... Kao što je rečeno, ovo je daleko od trivijalnog i dugoročno vam može uštedjeti vrijeme i novac ako zastanete i pročitate knjigu ili dvije. Još jedan razlog da pokušate naučiti više o "teoriji" i najboljoj praksi je taj što vam se trenutno čini da ste usredotočeni na riječi kršenja , ali u bliskoj budućnosti, tražilica bi također mogla imati koristi od toga posljedična svijest ; doista, ova dva pitanja su barem lingvistički relevantna i mogu biti korisna kada se obrađuju u tandemu.

Sretno u ovom neugodnom, ali vrijednom pothvatu.

0

@Joe: nema na čemu. Čini se da me zanimaju lingvistika i NLP, ali vrlo, vrlo malo znanja o CJK jezicima. Pročitajte moju izmjenu dodajući neke ključne riječi i internetske veze koje bi mogle pomoći vašoj pretrazi :-) - mjv 22. listopada 09

Kineski je jedan od najstarijih pisanih jezika na svijetu. Njegova povijest seže unatrag najmanje 3 tisuće godina. Natpisi na njemu pronađeni su na kornjačinim oklopima iz dinastije Shang (1766.-1123. pr. Kr.).

Povijest kineskog pisma

Kinesko pismo je mlađe od sumerskog ili egipatskog, ali nema dokaza da je izum pisma u Srednjem kraljevstvu bilo na bilo koji način potaknut pismom Bliskog istoka. Najraniji primjeri kineskih znakova su tekstovi za proricanje na kostima i školjkama. Sastoje se od pitanja vračaru i odgovora na njega. Ovaj rani zapis pokazuje da se u svojim ranim danima temeljio na piktografima. Na primjer, riječ "krava" bila je prikazana s glavom životinje, a "hod" je bila prikazana sa slikom stopala.

Međutim, s vremenom je kinesko pismo doživjelo mnoge promjene i do vremena (206. pr. Kr. - 220. g. po Kr.) izgubilo je većinu svoje figurativnosti. Moderni hijeroglifi nastali su tijekom 3. i 4. stoljeća nove ere. e. Začudo, nakon toga su ostali gotovo nepromijenjeni. Osim standardnih obrazaca, postoji i nekoliko rukom pisanih obrazaca. Najčešći su Tsaoshu i Xingshu. Prvi tip je vrlo teško čitati osobama bez posebne obuke. Xingshu je neka vrsta kompromisa između velike brzine Caoshua i standardnog pisanja. Ovaj oblik se naširoko koristi u modernoj Kini.

Koliko znakova ima kineski?

Kako bi predstavili svaki morfem u vokabularu, Kinezi koriste pojedinačne razlikovne znakove. Velika većina znakova su pisane verzije izgovorenih glasova koji imaju semantičko značenje. Iako se sustav pisma mijenjao tijekom vremena zbog revolucija i političkih prevrata, njegova načela, zajedno sa simbolima, ostala su u biti ista.

Kineski znakovi riječi izvorno su prikazivali ljude, životinje ili predmete, no tijekom stoljeća postajali su sve više stilizirani i više nisu nalikovali onome što predstavljaju. Iako ih ima oko 56 tisuća, velika većina ih je tipičnom čitatelju nepoznata - treba ih poznavati samo 3000 da bi bio pismen. Možda ova brojka najpouzdanije odgovara na pitanje koliko znakova ima kineski jezik.

Pojednostavljeni logogrami

Problem učenja tisuća znakova 1956. doveo je do pojednostavljenja pisanja kineskih znakova. Kao rezultat toga, oko 2000 logograma postalo je lakše čitati i pisati. Oni se također podučavaju na satovima mandarinskog u inozemstvu. Ovi simboli su jednostavniji, odnosno imaju manje grafičkih elemenata od tradicionalnih.

Pojednostavljeni znakovi postoje već stotinama godina, ali su službeno uključeni u pisanje tek nakon osnutka Narodne Republike Kine 1950-ih kako bi se poboljšala pismenost. Pojednostavljene logograme koriste narodne dnevne novine People's Daily i koriste se u podnaslovima za vijesti i video zapise. Međutim, ljudi koji pišu ispravno možda ne znaju tradicionalnu verziju.

Ovaj je sustav standardan u NR Kini (osim Hong Konga) i Singapuru, a tradicionalni kineski i dalje je standard u Hong Kongu, Tajvanu, Makau, Maleziji, Koreji, Japanu i drugim zemljama.

Fonetsko pismo

Govornici kantonskog razvili su vlastiti sustav fonetskih znakova. Ovi se znakovi koriste uz tradicionalne kineske znakove, primjerice u stripovima ili zabavnim odjeljcima novina i časopisa. Često se ti hijeroglifi ne mogu pronaći u rječniku. Za prenošenje se koriste neslužbeni logogrami

Pinyin

U pokušaju da kineski jezik učini razumljivijim Zapadu, Kina je razvila sustav Pinyin. Koristi se za prenošenje riječi 1977. godine vlasti NR Kine uputile su službeni zahtjev Ujedinjenim narodima za imenovanje geografskih mjesta u Kini pomoću sustava Pinyin. Pinyin koriste oni koji bolje poznaju latinicu i uče govoriti kineski.