自然言語処理を研究していた人がこんなことを言っていた。
「日本語で数を数える時、
下から数えると いち、に、さん、し、ご、ろく、しち、はち、く、じゅう
上から数えると じゅう、きゅう、はち、なな、ろく、ご、よん、さん、に、いち
なぜか4と7と9の読み方が変わる」
確かに。「いち、に、さん、よん」と言わないこともないが、「し」の方がしっくりくる。そして「ご、し、さん、に...」とは決して言わない。教えてくれた人もなぜ変わるのかは知らないようだった。
以来その理由はずっと謎だったのだが、答の書いてあるページを見つけた。
つまり、例えば4の読み方でいうと、
- 数字4の読み方「し」と「よん(or よ)」のうち、普通は「よん(or よ)」の方を使う(例: 「4メートル」「4歳」「4階」「4年4組」)
- 「し」の方は決まりきった成句や慣用表現で使われる(例: 四苦八苦、四面楚歌、四の五の言う、四球)
- 我々は、よく使う数え方「1,2,3,4,...」を一種の慣用表現ととらえて4には「し」を使う。逆に上からの「5,4,3,2,1」は慣用表現とはとらえられないので4が「よん」になる
まさに目からウロコ。そういうことであったか。
考えてみると、例えば電話番号が06-9999-1234のとき、1234のところを「いちにいさんしい」と言うか「いちにいさんよん」と言うかは微妙である。後者の方が自然な感じか。これは数を数えているのではなく番号を言っていることを意識していることになる。
日本語を少しだけかじっていたイギリス人に「明日の会議は何時から?」と(英語で)聞いたら日本語で「きゅうじ!」と言われたことがあった。9時だと言いたかったらしい。9は普通「きゅう」だが(「9メートル」「9歳」...)成句や慣用表現では「く」になる、という法則に当てはめると、我々は「9時」を慣用表現扱いしていることになる。同じように7は普通「なな」だが、「7時」は「しちじ」である(「ななじ」とも言うが)。しかし「4時」は「しじ」ではなく、普通の読み方である「よ」の方を使って「よじ」となる。他に、「7人」は「ななにん」「しちにん」、「9人」は「きゅうにん」「くにん」どちらもあるが、「4人」は必ず「よにん」で、「しにん」とは言わない。こうしてみると、慣用表現用の「し」「しち」「く」のうち「し」は特に使われる範囲が狭いようである。これはなぜかわからない。謎はまだ残っているのであった。