誤変換
出典: フリー百科事典『ウィキペディア(Wikipedia)』
誤変換(ごへんかん)はワープロやパソコンなどで日本語を入力する際の平仮名から漢字への変換処理で、語句を間違えて確定してしまったことにより生ずる現象である。
誤植がある文字がよく似た文字に置き換わるのに対して、誤変換は、あることばが別の同音異義語に置き換わるという結果をもたらす。影響として文章の辻褄が合わなくなってしまったり、最悪の場合、文章の意味が違う方向に通ってしまい誤解を招くということがあげられる。
誤変換の問題は、近年ワープロ(パソコン)の台頭により注目されるようになっている。
目次 |
[編集] 誤変換の例
- 単純な誤変換(一語単位)
- 文章の辻褄が合わなくなるもの
- 私は巧言に行きたい。(本来は巧言ではなく高原)
- 文章の辻褄が合ってしまうため誤解を生むもの
- 私は荒原に行きたい。(本当は荒原ではなく高原に行きたかった)
- 文章の辻褄が合わなくなるもの
- 複雑な誤変換(文章の区切りがおかしいもの)
-
- パンツ食った少年。(本来はパン作った)
- 砂糖と塩。(本来は佐藤俊夫)
-
その他頻出のもの
- 内臓(内蔵)ディスク(などのパソコン内部に組み込まれた周辺機器)
- 衛生(衛星)放送 - 人工衛生(衛星) - 人口衛生(人工衛星)
- プリント基盤(基板)
- 消火器と消化器の取り違え
- 確率という名詞を確立で誤用している文面が非常に多い。
- 固有名詞
[編集] 誤変換の起こりうる状況
誤変換の起こる虞は日本語入力システム(以下、システム)を使っているうちはいつでもあるが、誤変換が起こりやすい状況があるのでそれをいくつか挙げる。
- 変換アルゴリズムの不備によるもの
- 簡単なシステムでは最長一致法が用いられている場合が多い。このアルゴリズムはそこそこうまく働く。しかし、語句の『中身』に着目しない単純な方法であるので、失敗する場合も多い。ワープロ時代には誤変換の多くはアルゴリズム自体の不備であった。近年のシステムではアルゴリズムが改善され、誤変換の多くは学習機能によるものである。
- いつもセットにして使う二つ以上の言葉(成句、ことわざなど)の一つをほかの言葉と共に、あるいは単独で変換しようとするとき。
- 学習機能を有するシステムの場合、直前の言葉がこれなら次の言葉はこれだ、という風な判断が出来る。したがって、いつもセットで使っている言葉の組み合わせがあるとき、変換は変換キー(あるいは空白キー)を一回タイプするだけで終了する。それに慣れきっているので、そのことばを単独で、あるいはほかの言葉と共に使う場合も、思わず変換キーを一回タイプしてすぐに確定させてしまう。そのことにより誤変換が生ずる。
- 自分が普段使っていないシステムを使うとき。
- 新しいワープロ・パソコンを購入したときや、友人・会社のものを使うときなど、普段のものでないシステムを使用するときには、その日本語入力システムは自分の変換を学習していないため、変換キー一回では望ましい変換がなされないことが多い。しかし普段と同じ要領ですぐ確定させてしまうため誤変換が生ずる。特にATOKを普段使用している者がMS-IMEを使用するとATOKの変換能力に慣れているためMS-IMEの変換の違いについて行けない場合が多い。逆に、MS-IMEばかり使っているユーザがATOKを使った時にも使いにくいと感じる。
- 他人に貸したあと。
- 前記と関連しているが、事情あって他人に自分のシステムを一時的に使わせる場合もあるだろう。しかしそうすると、システムが他人の変換を学習するために、辞書の優先順位が変わっていることがしばしばである。よって、誤変換の元となる。
- 普段そのシステムで入力しない文面を入力するとき。
- 特定のシステムが使われる範囲はある程度決まっているため、特定の内容の文章入力に特化した形で学習がなされてゆくことになる。これが災いして、業務用のシステムで私用の文章を作成しようとした場合(およびその逆)などに、おかしな変換がなされる。(これに関しては、モード切替を行うことによって対処できるシステムがある。)
- 自分を購買対象としていないシステムを使い始めたうち。
- 最近になって生まれた現象。一部の携帯電話など、メーカー側が購買対象をある程度絞っている商品に組み込まれたシステムでは、出荷時状態で、その対象のユーザーによる変換を想定した学習がなされている。よって、自分のスタイルがその対象と合致していればよいが、そうでない場合、苦労することになる。
- 定型文を辞書登録しているとき。
- 多くのシステムは、自身の辞書にない単語をユーザーによって補強するための辞書登録機能を有している。この機能を用いて、自分の名前や業務上の定型文、あるいは顔文字など、使用頻度が高く、かつタイプに手間がかかる長い文字列を、数タイプで済む簡単な「読み」で登録することによってキータイプの手間を省くユーザーは多い。しかし、ここであまりに短い読みで登録してしまうと、ときおり普通に変換したい文章内であらぬパターンマッチングを起こし、思いもよらぬ文章に変換される。(特にこうした「単語」は使用頻度が高い分、学習機能によって優先順位が非常に高くなっている!)
- 自分の「学習」が間違っている場合。
- 漢字の読み、あるいは語句そのものを間違えて覚えている場合、システムは極めて真っ当に変換をおこなっているのであるが、使用者本人にとっては<おかしな>変換をおこなっているように感じる(ex.「ふいんき(雰囲気:ふんいき)」「かぐし(香具師:やし)」「しゅみれーしょん(Simulation:シミュレーション)」)。
[編集] その他
- 誤変換は時として面白さをはらむことがあり、それが漢字への興味をもつきっかけになることがある。このため、漢字検定を行っている日本漢字能力検定協会はWebページ上で「変“漢”ミスコンテスト」なるものを催している([1])。
- ロボット型検索エンジンにおいて、誤変換やタイプミス、スペルミスを想定した上で、「もしかして:」などの語句と共に、正しいと思われる検索語に誘導する機能が導入されている。しかし、正しい語句を誤った語句に誘導する(しかも、その誘導先の語句が可笑しいものであったりする)という、笑い話のような例もある。
- OCRや手書き文字認識においても誤認識の問題があり、誤植に似た結果をもたらすことがある。コンピュータにより言語処理の自動化を行っていたとしても、人間の目によるチェックは欠かせない。
- かつてジャストシステムは自社のワープロソフト、一太郎のCMにて「正しい日本語を選ぼう」という触れ込みで、ライバル(MS-IME)の誤変換を揶揄したCMを作った。そのときに登場した用例が「入れた手のお茶」「ガイドが天上する」であり、正しくは「入れ立てのお茶」「ガイドが添乗する」である。その後、MS-IMEは次作にて誤変換を訂正したが、ATOKはそれを悪乗りして、次作から「入れた手」をそのまま名詞として登録しており、現在のバージョンでもなお、わざと誤変換可能になっている。