なぜ中国人は単語の間にスペースを入れずに書くのでしょうか? 中国語に関する興味深い事実。 ペアになっている文字の種類

中国語を書くときにスペースを導入する利点

1. 読みやすさの向上: 単語の境界を追加すると、中国語のテキストを読むときの認知的負荷が軽減されます。 テキストがスペースなしで書かれている場合、読者は単語がどこで始まりどこで終わるのかを分析すると同時に、テキストの意味を理解しようとする必要があり、すでに難しい作業が複雑になります。

2. 中国語で書かれたテキストのより正確な機械処理: 中国語テキストのこのような処理を開始する前に、まずテキストをセグメント化する必要があります。 象形文字を使用する言語を処理する場合、これは簡単な作業ではありません。 あまり正確ではないが高速な機械による方法 (約 90%) と、より正確であるものの遅い方法 (約 94 ~ 97%) がありますが、完璧な方法はありません。
中国語の文章に単語の間にスペースがあれば、分割する必要がなくなり、中国語のテキストの機械処理がはるかに簡単になります。 その結果、中国語からの翻訳作業が大幅に簡素化されます。

3. 学生の中国語学習を容易にする: 単語の間にスペースを入れると、単語や文章が理解しやすくなります。 私が初めて中国語を勉強し始めたとき、中国語は単語間にスペースがないため単語の境界を理解することが難しく、辞書に存在しない単語を調べるのに多くの時間を費やしました。 単語の間にスペースを導入すると、中国語学習者はより速く、より効率的に語彙を構築できるようになります。

中国語のテキストでは単語の間にスペースが必要ないのはなぜですか?

1. 言葉とは何ですか? 中国語の「言葉」の概念は非常に曖昧です。 その単語はどこで始まりどこで終わるでしょうか? ロシア語 (およびアルファベットに基づくその他の言語) のネイティブ スピーカーにとっての単純な質問は、中国語のネイティブ スピーカーを混乱させる可能性があります。 たとえば、過去時制を示す助詞「了」は単語の一部とみなされるべきでしょうか?
たとえば、「小刘来了」という文では、スペースをどこに入れますか - 小刘_来了 または 小刘来_了?書き言葉の理解。

2. 伝統: 中国語の文字は 3,000 年以上存在しており、この時代には単語の間にスペースが導入されていませんでした。 なぜ今それを紹介するのでしょうか?

3. 中国語のテキストは単語の間にスペースがない方が美しく見えます。 スペースを導入すれば、中国語学習者にとっては理解しやすくなりますが、中国語を学習したばかりの学習者の便宜のために言語体系を適​​応させる人は誰もいません。

追伸 1.古代ヨーロッパの文書にも単語の間にスペースはありませんでした。

追伸 2:ロシア語ではスペースが必要です。スペースがないとステートメントの意味が変わってしまうからです。
比較してください: 不条理なものと異なるものを運ぶ。

追伸 3.:ロシア語の文章も、スペースなしで書かれていれば、最初は理解するのが難しいですが、その後、私たちの脳は適応します。

中国のプロジェクトに取り組んだり、中国でキャンペーンを立ち上げたりしたことがある人なら誰でも、現地のデザインの考え方が西洋のそれとは異なることを知っています。 例を遠くまで探す必要はありません。中国の国際ブランドで働いている場合、または中国で販売される製品を作成している場合は、Baidu.com または QQ.com を調べて、オンラインの中国語であなたのブランドがどのように表現されているかを確認してください。空間。

最大の違いは、サイトが非常に乱雑に見えることです。 ページを読めなくするように設計されていると思われるテキスト、リンク、さらにはアニメーションが大量にあります。

デジタルカオスのように見えるかもしれませんが、中国のウェブサイトはいくつかの理由からそのように設計されています。 中国でビジネスを立ち上げることを計画している場合は、現地の Web エクスペリエンスのいくつかの機能を学ぶことをお勧めします。

中国語は全く違う

まず、知っておくべきいくつかの事実を次に示します。

1. 中国語には大文字はありません。 西洋の読者は、テキスト内の大文字を識別して文の始まりと終わりを見つけるように訓練されています。 中国語のサイトが似たような文字の集合のように見えるのはこのためです

2. 文字間にスペースは入れません。 西洋言語では単語を区切るためにスペースが使用されますが、中国語でも使用されません。 ここでは、長い文字列はまったく正常ですが、西洋のユーザーにとっては混乱を招きます。

3. 生地は作りましたか?原理的には、すべてが明らかですよね? 文字が逆になっている単語は、最初と最後の文字が正しい位置にあり、完全に逆に書かれていない限り、読みやすいです。 このため、人々はすべての単語を読むのではなく、テキストを目でざっと流し読みします。 しかし、彼らは同じように中国語の文章をざっと読むことができないので(その文字が彼らになじみがないと仮定して)、そのような文字の行は彼らにとって特に混沌としているように見えます。

4. 中国語の文字は、ラテン文字やキリル文字よりもはるかに「密度」が高く、1 文字に平均 10 画が含まれるのに対し、1 画または 2 画です。 このため、やはり、中国語のテキストは西洋のユーザーには「過負荷」に見えます。

次に不可解な特徴は、典型的な中国の Web サイトが 1 つの大きなリンクのように見えることです。 Sohu.com では、文字通りすべての文字がリンクの一部です。

これには 2 つの理論があります。 1 つ目は、アルファベット キーボードでは中国語の文字を入力するのが難しいため、ユーザーは検索ボックスを使用する代わりにリンクをクリックする傾向があるということです。

中国語の文字を入力するには、文字を描画するか、西洋文字を使用してピンインを書き写す必要があるため、これは非常に合理的です。

象形文字が書かれるか、その転写が印刷されると、記号のオプションが表示され、ユーザーはそこから正しいものを選択する必要があります。 これを何度も繰り返して検索するのはかなり大変なようです。

しかし、別の理論もあります。 そして、中国語版の Google 検索を提供する検索エンジン Baidu の人気を考えると、それを信じる理由があります。 この理論によると、多くの中国人は依然として低速インターネットを使用しています。 アカマイの調査による統計もこれを裏付けています。

国およびインターネット速度に応じたオンライン人口の割合: 4 MB/秒未満、4 MB/秒以上、10 MB/秒未満、10 MB/秒以上

ご覧のとおり、中国人の 3 分の 2 は 4 Mbps 未満の接続速度でインターネットを使用しています。これは世界の平均速度よりも大幅に低く、西側諸国ではほとんど前例のない速度です。

結論として、インターネットの速度が比較的遅い場合、多くのリンクを含む 1 ページを読み込んで新しいタブで開くのが合理的です。 これにより、ユーザーは一度に 1 つずつページを読み込むのに時間がかかり、苦痛になることなく、並行してページを閲覧できるようになります。 ダイヤルアップ インターネット接続を覚えている人なら、私たちが何を言っているのか理解できるでしょう。

最後に、中国の Web サイトでは、点滅するテキストやバナーが多用されています。

その理由は、中国語では異なるフォントを使用して注目を集めるのが西洋のテキストよりもはるかに難しいためであると思われます。 これには次のような多くの理由があります。

1. 漢字のフォントは数が少ないです。
2. イタリック体は存在せず、通常は太字は使用されません。
3. 最小フォント サイズ - 12 ピクセル

さらに(そしてここで文化的要素に目を向けますが)、中国人は単に西洋人よりも点滅するグラフィックスをあまり気にしていないように思えます。 その結果、私たちにとって過負荷に見えることは、彼らにとっては正常なことなのです。

さらに、西洋のサイトにポップアップが表示されるようになったことで、中国のリソースは以前ほど西洋のサイトと異なって見えなくなりました。

結論は

句読点はどの言語にも不可欠な部分です。 普通のコンマは文の意味を根本的に変える可能性があります。「死刑執行は赦されない」という話を思い出してください。 また、翻訳者や編集者の仕事では、少なくとも 2 つの句読点を流暢に扱えることが求められます。

この投稿のアイデアは、記事の翻訳について話し合っていたときに生まれました。 原文では、パーセント記号と数字がスペースで区切られており、これが私の目に留まりました。この場合、ロシア語のテキストではスペースが使用されていません(ただし、この記述はまだ物議を醸しています。専門家はまだ結論を出していません)この問題に関してはコンセンサスがあります)。 それから私たちはそれについて話し合う必要があると判断しました。 多言語ローカリゼーション部門のスペシャリストが外国人の同僚にインタビューし、資料を作成しましたので、ここで共有します。 ぜひお役立てください。

最初と最後に

文中の句読点 (ピリオド、コンマ、コロン、セミコロン、疑問符、感嘆符) の配置がどうなるかを見てみましょう。

皆さんもロシア語について覚えておいてください。文を互いに区切る句読点は最後のピリオドにのみ置かれます。 表現を追加する必要がある場合(特に個人的な通信の場合)、「!!!」、「?!」などの文字の組み合わせが使用されます。 など。 英語、ドイツ語、イタリア語、フランス系カナダ語、アラビア語、ブラジル系ポルトガル語では、点、楕円、およびその「同志」は同じ規則に従います。

フランス語のその他のルール: コロン、セミコロン、感嘆符、疑問符の前には非改行スペースが続きます。

スペイン語は、私たちが選択した言語の中で句読点が文章を構成する唯一の言語です。フレーズの先頭では、疑問符と感嘆符が「わずかに」反転した形式、つまり「¿」と「¡」で重複します。

ヨーロッパの観点から見ると、中国人は句読点に対して最も珍しいアプローチをとっています。 ピリオドは「。」、カンマは「,」、感嘆符は「!」、疑問符は「?」のようになります。 文の中で、彼らはロシア語と同じように動作します。唯一の違いは、中国語はすべての句読点文字が 2 バイトであるため、スペースを使用しないことです。 キーボードでタイプされた象形文字は、ラテンアルファベットの文字の 2 倍の幅があります。 したがって、句読点は通常、象形文字と同じスペースを占めます。 この機能は、DOS を実行している古い IME で作業していた人が、間違って入力した象形文字が Backspace キーを 2 回押すと削除されるときに遭遇しました。 スペースは主に、英語などの他の言語と単語や文字を区切るために使用されます。

かわいい特徴

ロシア語ではハイフンまたはダッシュが使用されます。 ハイフンは短く、複合語を転送して接続するために必要です。 ダッシュはかなり長くなります。 これは、異なる文、1 つの文の 2 つの部分、対話などの意味部分を分離するのに役立ちます。 ロシア語の教科書を見れば、これらの記号の使い方の微妙な点をすべて思い出すことができます。

ハイフンとダッシュは、英語、ドイツ語、フランス語、ブラジル系ポルトガル語でも同様の条件で存在します。 さらに、アメリカ英語ではダッシュの両側がスペースで区切られますが、イギリス英語では通常そうではありません。

この講義は今月でこのテーマに関する 3 回目であり、さまざまな国からの講演者が参加します。 (アメリカ英語)

動物園には、ライオン、ヒョウ、トラ、ジャガー、チーターなど、たくさんの猫がいて、お気に入りを選ぶのは非常に困難でした。 (イギリス英語)

スペイン語、イタリア語、アラビア語では、ハイフンとダッシュは同じ「-」に見えます。 中国人はハイフンをまったく使用せず、ダッシュのみを使用します。 ただし、ラテン語のアルファベットの文字の隣には、ハイフン、長いダッシュ、および中ダッシュがある場合があります。 ハイフンは短く、複合語を転送して接続するために必要です。 ダッシュはかなり長くなります。 意味部分を分離するのに役立ちます

言語 ハイフン Em ダッシュ (Alt 0151)
ロシア
英語 アメリカ人はい、ハイフネーションと複合語の結合用はい、意味上の部分を分離します: 異なる文、1 つの文の 2 つの部分、会話など。
英語
イギリス人
はい、ハイフネーションと複合語の結合用はい、意味上の部分を分離します: 異なる文、1 つの文の 2 つの部分、会話など。 両側がスペースで区切られていません。
ドイツ語はい、ハイフネーションと複合語の結合用はい、意味上の部分を分離します: 異なる文、1 つの文の 2 つの部分、会話など。
フランス語はい、ハイフネーションと複合語の結合用はい、意味上の部分を分離します: 異なる文、1 つの文の 2 つの部分、会話など。
フランス系カナダ人はい、ハイフネーションと複合語の結合用はい、意味上の部分を分離します: 異なる文、1 つの文の 2 つの部分、会話など。
スペイン語はい、すべての場合において-
ポルトガル語
ブラジル人
はい、ハイフネーションと複合語の結合用はい、意味上の部分を分離します: 異なる文、1 つの文の 2 つの部分、会話など。
イタリア語はい、すべての場合において-
アラブはい、すべての場合において-
中国語ラテンアルファベットの文字の隣にのみはい、すべての場合において
ペアになっている文字の種類


引用符はすべての言語に存在しますが、民族衣装と同様に、見た目が異なります。 ロシア語には、フランス語から来た伝統的な「クリスマスツリー」とドイツ語の「足」があり、これらは引用符内のフレーズや手書きの際に使用されます。 スペイン語、ブラジル系ポルトガル語、イタリア語、アラビア語では二重引用符が使用されます。

英語では「一重」引用符と「二重」引用符が使用されます。最初の引用符は見出しに使用され、2 番目の引用符は引用符に使用されます。 ピリオドとカンマは引用符で囲みます。 フランス語のテキストには「ヘリンボーン」がありますが、ロシア語との違いが 1 つあります。それは、引用されたテキストの先頭と開き引用符の間、およびフレーズの終わりと閉じ引用符の間に連続したスペースがあることです。

中国語には 3 種類の引用符があり、それぞれ異なる目的を果たします。 これらは、本、映画、その他の著作物の名前です。 それ以外の場合はすべて、中国人は「 such 」を使います。 ヨーロッパの伝統に由来する引用符 (「クリスマス ツリー」、「足」、「シングル」、「ダブル」のいずれであっても) は、翻訳の中で、またはヨーロッパ言語のフレーズと組み合わせてのみ使用できます。 繁体字中国語では人気がありません。

引用符はすべての言語に存在しますが、民族衣装と同様に、見た目が異なります。

言語«…» „…“ “…” ‘…’ 《…》 「…」
ロシア標準、ピリオドとカンマの外側引用符内の句内および手書きの場合の代替語手書きの場合の代替案- - -
英語
アメリカ人
- - 見出しの標準- -
英語
イギリス人
- - 引用時の標準、ピリオドとコンマの内側見出しの標準- -
ドイツ語- 標準- - - -
フランス語引用符の開閉前の標準的な非改行スペース- - - - -
スペイン語- - 標準- - -
ポルトガル語
ブラジル人
- - 標準- - -
イタリア語- - 標準- - -
アラブ- - 標準- - -
中国語翻訳またはヨーロッパ言語のフレーズと組み合わせた場合のみ翻訳またはヨーロッパ言語のフレーズと組み合わせた場合のみ翻訳またはヨーロッパ言語のフレーズと組み合わせた場合のみ本、映画、その他の著作物のタイトルの標準その他の場合の標準
象徴性

パーセントやppmも特に標準ではありません。 ドイツ語、フランス語、スペイン語では、これらの文字は非改行スペースで区切る必要があります。 また、ロシア語、英語、イタリア語、アラビア語、ブラジル系ポルトガル語では、数字の直後に書きます。 しかし、私たちが覚えているように、ロシア人の場合、状況は曖昧です。

度とインチは通常、数値の後にスペースを入れずに配置されます。

興味深い事実: フランス人は大きな数字を書くとき、3 桁のブロックをスペースで区切ります (例: 987,654,321.12)。

中国語には、度 (度) とパーセンテージ (百分比、百分之) を表す独自の文字があります。 ただし、通常の ° と % は、前にスペースを入れずに一緒に使用されます。

対話の確立

ダイアログの形式も言語によって異なります。 ロシア語では、各行の前に全角ダッシュを置きます。 ブラジル系ポルトガル語を話す人も同様です。

英語では、次のように「二重引用符」と「一重引用符」が使用されます。

「これは100万ポンドです」マリーナはサイモンにスーツケースを渡しながら言いました。

マリーナは続けて、「イワンと話したところ、『サイモンは1千万を要求しているが、それは多すぎる』と言いました。」

ドイツ語では、対話も伝統的な引用符「足」を使用してフォーマットされます。 フランス人は、行の作者が変わる場合に、短いダッシュだけでなく「ヘリンボーン」も入れます。 スペイン語でも会話の一部がダッシュで区切られています。

イタリア語とアラビア語では、会話に二重引用符を使用します。

中国人は通常、会話の中で「引用符」またはそれに相当する英語のみを使用します。

大きくても小さくても


英語、フランス語、スペイン語、ポルトガル語、ブラジル語、イタリア語では、ロシア語話者にとってはすべてがシンプルで馴染みがあり、略語や固有名詞には文頭で大文字が使用されます。

ドイツ語はもっと楽しいです。 名詞、名前、タイトル、住所の丁寧形 (Sie) はすべて大文字で書かれます (Ihr、Ihre、Ihrer、Ihres、Ihrem、Ihren)。 文中で定冠詞 (das Gute) または不定冠詞 (ein Lächeln)、前置詞 (Blau)、代名詞 (dein Stotton)、数字 (nichts Aufregendes) または形容詞と組み合わせて名詞として文中で使用される形容詞、分詞、不定詞。活用形 (lautes Sprechen)。 まさにすべて:-)

アラビア語のアルファベットには小文字と大文字の区別はありませんが、ほとんどの文字には 2 つ、3 つ、または 4 つの異なるスペルがあり、単語の先頭、中間、末尾に使用され、場合によっては単語の外側の 1 文字に使用されます。 同様の状況が中国語でも発生しています。小文字と大文字を区別できる可能性は低いです。 そして、中国人の著者がテキストの一部を強調する必要がある場合、下線を引くか太字を使用します。

16

MySQL の全文検索を日本語や中国語、その他の言語でも機能させたいと考えています。 問題は、これらの言語、そしておそらく他の言語では通常、単語の間にスペースが存在しないことです。 本文と同じ文章を入力する必要がある場合、検索は役に立ちません。

英語も必要なので、各文字の間にスペースを入れることはできません。 この問題をPHPまたはMySQLで解決したいと考えています。

独自のインデックスとなる文字を認識するように MySQL を構成できますか? これらの文字を認識して、インデックスの前後のスペースを無視できる PHP モジュールはありますか?

部分的な解決策:

$string_with_spaces = preg_replace("/[".json_decode(""\u4e00"")."-".json_decode(""\uface"")."]/", " $0 ", $string_without_spaces);

これにより、特別に処理する必要がある少なくとも一部の文字から文字クラスが作成されます。 おそらく、インデックス付きテキストをスキップすることは許容されると言及する必要があるでしょう。

プローブに挿入する必要がある文字の範囲をすべて知っている人はいますか?

また、これらの文字を PHP で表現するための、より優れた移植可能な方法はないでしょうか? リテラル Unicode のソース コードは完璧ではありません。 すべての文字を認識できるわけではありません。 使用する必要があるすべてのマシンに表示されない可能性があります。

3

単語間にスペースを使用しない他の現代言語には、タイ語、ラオス語、クメール語 (カンボジア)、ビルマ語 (ミャンマー) があります。 ベトナム語では、外来語を除くすべての音節間にスペースが使用されるという関連した問題があります。 - ヒッピートレイル 12月18日 10 2010-12-18 12:48:10

  • 2 つの答え
  • 並べ替え:

    活動

15

言及されている言語の単語違反には必須が必要です 言語的アプローチ 、たとえば、 辞書基本的な理解とともに ルールが生まれる.

エンドユーザーが提供した検索条件と同じ「トークン化」を適用するだけで、個々の文字を中国語の個別の単語として分離するだけで、比較的成功した全文検索アプリケーションについて聞いたことがあります。 検索エンジンは、検索基準と同じ順序で単語文字を提供するドキュメントに対して、より良いランキングを提供します。 ひらがなやカタカナの文字セットにより、テキストが短いアルファベットのヨーロッパ言語に似たものになるため、これを日本語のような言語に拡張できるかどうかはわかりません。

編集:
リソース
この言葉は問題やそれに関連する問題を分解するためのものです。 重要な本全体がそれについて書かれているということ。 たとえば、CJKV 情報処理を参照してください (CJKV は中国語、日本語、韓国語、ベトナム語を表します。多くのテキストではベトナム語について説明していないため、CJK キーワードを使用することもできます)。 「日本語の単語の区切りは、このトピックに関する概要資料としては難しい」も参照してください。
このトピックをカバーする資料のほとんどは、母国語の主要言語のいずれかで書かれているため、これらの言語に比較的習熟していない人々に限定されることは明らかです。 このため、検索エンジンのテストを容易にするために、ワード ブレーク ロジックの実装を開始したら、ネイティブ スピーカー 1 人か 2 人の助けを求める必要があります。

いろいろなアイデア
あなたのアイデア 単語の区切りを体系的に暗示する特徴を特定する(引用符、括弧、ハイフンのような記号など) は適切であり、これはおそらく一部の専門的な単語区切りで使用されるヒューリスティックの 1 つです。 ただし、そのようなリストについては、事例報告に基づいて最初から作成するのではなく、信頼できる情報源を探す必要があります。
関連するアイデアは、単語を次のように分割することです。 かなから漢字への移行(しかし、その逆はないと思います)そしておそらく ひらがなからカタカナへまたはその逆の遷移。
壊れた正しいものとは関係なく、インデックスは、たとえば、各ひらがな文字を対応するカタカナ文字に体系的に変換することで恩恵を受ける場合があります[-またはそうでない場合もあります- ;-)]。 ただの無教養な考えだ! 私は日本語についてあまり詳しくないので、これが役に立つかどうかわかりません。 直観的には、これは、ヨーロッパのいくつかの言語で行われている、アクセント付き文字の体系的な変換、つまり対応するアクセントのない文字への変換と大まかに関連していると考えられます。

おそらく、個々の文字を体系的にインデックス付けする (そして、検索語への近似に基づいて検索結果をランク付けする) という先ほど述べたアイデアは、たとえば、連続するかな文字をまとめて保持し、その後に他のルールを適用するなど、わずかに変更できる可能性があります...しかし、非常に実用的な検索エンジンです。

そうでなくてもがっかりしないでください... 前述したように、これは決して簡単なことではなく、一時停止して本を 1 ~ 2 冊読むことで、長期的には時間とお金を節約できます。 「理論」とベスト プラクティスについてもっと学ぼうとするもう 1 つの理由は、現時点では次のことに集中しているように見えるからです。 違反の言葉 しかし、近い将来、検索エンジンも恩恵を受ける可能性があります。 結果的意識 ; 実際、これら 2 つの質問は少なくとも言語的に関連しており、並行して処理すると役立つ可能性があります。

この不愉快ではあるが価値ある取り組みで幸運を祈ります。

0

@ジョー: どういたしまして。 私は言語学と NLP に興味があるようですが、CJK 言語に特有の知識はほとんどありません。 あなたの検索に役立つかもしれないいくつかのキーワードとオンラインリンクを追加した私の編集を読んでください:-)。 - mjv 10月22日 09

中国語は世界最古の書き言葉の一つです。 その歴史は少なくとも3000年前に遡ります。 その碑文は商王朝(紀元前1766年~紀元前1123年)の亀の甲羅で発見されています。

漢文の歴史

中国語の文字はシュメール語やエジプト文字​​よりも新しいですが、中王国における文字の発明が近東の文字によって何らかの形で刺激されたという証拠はありません。 漢字の最古の例は、骨や貝殻に書かれた占いの文字です。 占い師への質問とそれに対する回答で構成されています。 この初期の文章は、初期の頃は絵文字に基づいていたことを示しています。 たとえば、「牛」という言葉は動物の頭で描かれ、「歩く」という言葉は足の絵で描かれていました。

しかし、時間の経過とともに、中国語の文章は多くの変化を遂げ、その時点(紀元前 206 年から紀元後 220 年)までに、比喩性のほとんどが失われていました。 現代の象形文字は、西暦 3 世紀から 4 世紀に形成されました。 e. 驚いたことに、その後はほとんど変化がありませんでした。 標準的なフォームに加えて、手書きのフォームもいくつかあります。 最も一般的なのはTsaoshuとXingshuです。 最初のタイプは、特別な訓練を受けていない人にとっては非常に困難です。 Xingshu は、Caoshu の高速性と標準的な書き込みの間の一種の妥協点です。 この形式は現代中国で広く使用されています。

中国語には何文字ありますか?

語彙内の各形態素を表すために、中国人は単一の特徴的な文字を使用します。 記号の大部分は、意味的な意味を持つ音声を文字に変換したものです。 文字体系は革命や政変により時間の経過とともに変化しましたが、その原則とその記号は本質的に同じままです。

中国語の文字はもともと人、動物、物体を描いていましたが、何世紀にもわたってますます様式化され、もはやそれらが表すものとは似ていません。 そのうち約 56,000 個ありますが、その大部分は一般的な読者には知られていません。読み書きできるようになるためには、そのうちの 3,000 個を知っていれば十分です。 おそらくこの数字が、中国語には何文字あるのかという疑問に最も確実に答えます。

簡略化された表語文字

1956 年に数千文字を学習するという問題が発生し、漢字の書き方が簡略化されました。 その結果、約2000の表語文字が読み書きしやすくなりました。 海外の中国語クラスでも教えられています。 これらのシンボルはよりシンプルです。つまり、従来のシンボルよりもグラフィック要素が少なくなっています。

簡体字は何百年も前から存在していましたが、1950 年代の中華人民共和国の建国後、読み書き能力を向上させるために正式に文字に取り入れられたのです。 簡略化された表語文字は、人民日報の人民日報で使用され、ニュースやビデオの字幕に使用されます。 ただし、正しく書く人は従来のバージョンを知らない可能性があります。

このシステムは中国 (香港を除く) とシンガポールの標準であり、繁体字中国語は香港、台湾、マカオ、マレーシア、韓国、日本およびその他の国で引き続き標準です。

ふりがな

広東語話者は独自の発音記号システムを開発しました。 これらの文字は、漫画本や新聞や雑誌のエンターテイメント セクションなどで、伝統的な漢字に加えて使用されます。 多くの場合、これらの象形文字は辞書で見つけることができません。 非公式の表語文字は、次のことを伝えるために使用されます。

ピンイン

中国語を西洋人にとってより理解しやすいものにするために、中国はピンイン システムを開発しました。 1977 年に中国当局は、ピンイン システムを使用して中国の地理的場所の名前を付けるよう国連に正式に要請しました。 ピンインは、ラテン語のアルファベットに精通しており、中国語を学習している人によって使用されます。