• 仕事
  • おもしろ

人工知能で日本語の手書き文字解読ソフトを開発したニュースについて

2016.04.14

人工知能で日本語の手書き文字解読ソフトを開発したニュースについて

 ブルームバーグニュースに「日本語のできない外国人が手書き文字解読ソフト開発-人工知能で」というタイトルの記事が掲載されていました。 

 コンピューターによるディープラーニング(深層学習)の技術を活用した、日本語の手書き文字の読み取りプログラムができたとのこと。人間の神経回路網の仕組みを人工知能に取り込んだ深層学習技術を応用させたものだそうです。 

 開発者の4人が全員外国人で、日本語がほとんどできないのにこのソフトを開発できたという点もさることながら、筆者がこの記事を読み進めていて気になったポイントが2つありました。 


 1つ目は、日本語は手書き文字認識において、他の言語とはまったく「別物」だということ。
 実は、“手書きの英文テキストを読み取るのは、深層学習の世界では初級の技術”なのだそうですが、日本語はまったく違うようなのです。
 理由は、漢字です。

・常用漢字の数が2,000以上もある。
・画数が多いものがある。
・漢字を構成する部分が、それ単独で別の漢字になることがあるため、どこまでが1つの漢字と見なすべきかの判別が難しい。
 さらに、日本語には漢字に加えてひらがな、カタカナもあり、複雑になるそうです(たしかに、漢字と同形のカタカナが存在しますよね)。  
 手書きでは、走り書きしたり、続け字になったり、人によっては漢字の一部分を簡略して書いたりすることがあり、個人差が非常に大きくなります。
 以前に、海外出身の人にとって、手書きされた日本語は非常に読み取りづらいという話を聞いたことがあります。人工知能も“日本語を知らない外国人”と考えれば納得です。実際、記事にも“彼らは約180万通りの手書き文字のデータセットをトレーニングに活用した”とありましたが、プログラムの世界においても日本語は特殊な言語のようです。

 2つ目は、このプログラムが開発されたきっかけが、教育測定研究所から毎年約120万人分の手書き答案用紙の採点について支援を要請されたことだったという点です。

 教育測定研究所は、文部科学省が行う全国学力・学習状況調査や、OECDが実施する国際成人力調査(PIAAC)本調査などの業務を委託されているところです。2020年に向けた大学入試改革では、記述式の試験の採択も検討されていると聞きます。

 今回開発されたプログラムは、もしかすると私たちが受験する試験の採点に用いられる可能性があり、決して無関係な話ではないようです。

〔リンク〕
 「日本語のできない外国人が手書き文字解読ソフト開発-人工知能で」 ブルームバーグニュース
 https://www.bloomberg.co.jp/news/articles/2016-04-13/O573B16JTSE901

続きを見る

  • twitter
  • facebook
  • はてなブックマーク
  • LINE
  • google+

おもしろ

  • 漢字ペディア2021年下半期アクセス数ランキング発表!1位は東京五輪で注目されたあの漢字

    漢字ペディア2021年下半期アクセス数ランキング発表!1位…

     こんにちは、漢字カフェ担当のキンスケです。  公…

    記事を読む

  • クイズ番組で話題の難読漢字にチャレンジ!その4~漢検1級でも出ない激ムズ漢字とは?~

    クイズ番組で話題の難読漢字にチャレンジ!その4~漢検1級で…

     こんにちは。漢字カフェ・激ムズ漢字担当のグッピー…

    記事を読む

  • 漢検準1級配当漢字をなぞ解きで学ぼう!第50問

    漢検準1級配当漢字をなぞ解きで学ぼう!第50問

     こんにちは。漢字と謎解きをこよなく愛する謎作り人…

    記事を読む

  • 漢検準1級配当漢字をなぞ解きで学ぼう!第49問

    漢検準1級配当漢字をなぞ解きで学ぼう!第49問

     こんにちは。漢字と謎解きをこよなく愛する謎作り人…

    記事を読む

  • 2021年「今年の漢字」こぼれ話 2020年との違いは?

    2021年「今年の漢字」こぼれ話 2020年との違いは?

     こんにちは、漢字カフェ担当のキンスケです。  2…

    記事を読む

  • 漢検準1級配当漢字をなぞ解きで学ぼう!第48問

    漢検準1級配当漢字をなぞ解きで学ぼう!第48問

     こんにちは。漢字と謎解きをこよなく愛する謎作り人…

    記事を読む

おもしろ記事一覧へ

仕事

  • SNSで話題『漢字の使い分けときあかし辞典』で、同訓異字を使いこなそう!

    SNSで話題『漢字の使い分けときあかし辞典』で、同訓異字を…

     こんにちは、漢字カフェ担当のキンスケです。  「…

    記事を読む

  • 社会人も要チェック!よくある漢字の間違い5選~漢検・採点現場より①~

    社会人も要チェック!よくある漢字の間違い5選~漢検・採点現…

     公益財団法人 日本漢字能力検定協会は、日本漢字能…

    記事を読む

  • 新聞漢字あれこれ44 コロナ渦の影響はいかに?

    新聞漢字あれこれ44 コロナ渦の影響はいかに?

     この春、インターネットを使ったビデオ会議システム…

    記事を読む

  • 『四字熟語ときあかし辞典』で、四字熟語をもっと身近に!

    『四字熟語ときあかし辞典』で、四字熟語をもっと身近に!

     皆さんは、文章を書いたり話したりするときに、毎回…

    記事を読む

  • パソコンで扱える漢字が6万字に。国際規格化が完了。

    パソコンで扱える漢字が6万字に。国際規格化が完了。

     12月25日、IPA(独立行政法人情報処理推進機…

    記事を読む

  • 岩波書店が「日本語力調査」を発表!30代は日本語に鈍感!?

    岩波書店が「日本語力調査」を発表!30代は日本語に鈍感!?

     『広辞苑』、『岩波国語辞典』の発行元である岩波書…

    記事を読む

仕事記事一覧へ

PR記事
  • 【読者プレゼントあり!】諸橋轍次記念館編『行不由徑(ゆくにこみちによらず)』が発売!

    【読者プレゼントあり!】諸橋轍次記念館編『行不由徑…

    記事を読む

  • 令和4年度「日本漢字能力検定協会賞」を受賞! お笑い芸人きくりんさんに聞く“漢字学習の道”【後編】

    令和4年度「日本漢字能力検定協会賞」を受賞! お笑…

    記事を読む

  • 令和4年度「日本漢字能力検定協会賞」を受賞! お笑い芸人きくりんさんに聞く“漢字学習の道”【前編】

    令和4年度「日本漢字能力検定協会賞」を受賞! お笑…

    記事を読む

  • 2020年「今年の漢字」こぼれ話(前編)2020年は「初」だらけ!

    2020年「今年の漢字」こぼれ話(前編)2020年…

    記事を読む

  • 「令和」だけじゃない! 2019年「今年の漢字」の「令」は、○○の「令」

    「令和」だけじゃない! 2019年「今年の漢字」の…

    記事を読む

最新記事
  • 頭の体操!漢字クイズに挑戦!③【難易度★★☆☆☆】

    頭の体操!漢字クイズに挑戦!③【難易度★★☆☆☆】

    記事を読む

  • 新聞漢字あれこれ142 「追及・追求・追究」の使い分け

    新聞漢字あれこれ142 「追及・追求・追究」の使い分け

    記事を読む

  • 「嬲」と「嫐」の各地での受け入れと変容⑧ ~フランス在住のルーマニア人の「嬲」~

    「嬲」と「嫐」の各地での受け入れと変容⑧ ~フランス在住の…

    記事を読む

  • 頭の体操!漢字クイズ   に挑戦!②【難易度★★☆☆☆】

    頭の体操!漢字クイズ に挑戦!②【難易度★★☆☆☆】

    記事を読む

  • 新聞漢字あれこれ141 「麴」と「麹」どちらを使うか

    新聞漢字あれこれ141 「麴」と「麹」どちらを使うか

    記事を読む

  • やっぱり漢字が好き20「尿禁」?「禁尿」? ~二字熟語の語構成~

    やっぱり漢字が好き20「尿禁」?「禁尿」? ~二字熟語の語…

    記事を読む

  • 空欄に入る果物は?漢字クイズに挑戦!①【難易度★★★☆☆】

    空欄に入る果物は?漢字クイズに挑戦!①【難易度★★★☆☆】

    記事を読む

  • 新聞漢字あれこれ140 企業名の「ハシゴダカ」をどうするか

    新聞漢字あれこれ140 企業名の「ハシゴダカ」をどうするか

    記事を読む

  • 「嬲」と「嫐」の各地での受け入れと変容⑦ ~フランス人の「嬲」~

    「嬲」と「嫐」の各地での受け入れと変容⑦ ~フランス人の「…

    記事を読む

  • 新聞漢字あれこれ139 紙幣の「かいさつ」を考える

    新聞漢字あれこれ139 紙幣の「かいさつ」を考える

    記事を読む

記事カテゴリ
  • 公益財団法人 日本漢字能力検定協会
  • 漢字を調べるなら漢字ぺディア
  • 日本漢字学会(JSCCC)
  • メールマガジンのご登録

ページトップへ

Copyright(c) 公益財団法人 日本漢字能力検定協会 All Rights Reserved.