以前、"AI(笑)プログラミングをしての感想"という記事の中で
"プログラミングより「使えるデータ」を集める方が大事"
"業務適用へのハードルは高い"
という事を書いた。
これについて少し書いてみようと思う。
まず、業務で使うデータはその企業内の機密情報であることが多い。特に私がやったような画像認識を業務に応用しようとする場合は、ものすごい個人情報を含んだ画像を処理することになる。
私が以前勤めていた銀行業界の業務の中で画像認識が必要な場面は
・本人確認書類の確認(免許証、保険証etc)
・印鑑照合
がある。
まず、本人確認書類の確認について免許証を例にあげてみよう。
金融機関に限らず、免許証などの公的書類で本人確認を行う業務は多い。
今の業務フローだと、いちいち人の目で免許証の原本またはコピーを確認して、免許証番号や住所などをデータとして顧客管理台帳などに入力している。
免許証自体はフォーマットが決まっており、いちいち人の目で確認しなくても免許証番号や有効期限、住所などの確認はAI(笑)を使って自動化できるように思う。
しかし、ネット上に学習に必要な生の免許証画像データなどは出回っていないので、少なくとも自社で十分なデジタルの免許証画像データを持っている企業でないと、そもそもAI(笑)導入以前の問題である。
また、運よく(?)自社で機械学習させるに十分な量の免許証画像データを保有していたとしよう。
そして、AIプロジェクトが上手く進行し99.9%の精度で免許証による本人確認業務が実装できたとする。
しかし、99.9%の精度では「本人確認」という業務においては不十分である。
なぜならば、法律上100%の精度での本人確認が求められているからだ。
例え精度が99.999%であっても問題である。
誤って本人識別をしてしまった0.001%に反社会的勢力が紛れ込んでいたら行政処分を受ける(銀行の場合)。
ということで、リスクを排除するには、AI(笑)だけでなく、人の目や別のシステムによるダブルチェック、トリプルチェックが必要となる。
これでは何のためにAI(笑)を導入したのか訳がわからない。
AI導入をする前より業務フローが増えるという訳の分からない事になる。

このような問題を解決するには、
・そもそも人間中心の業務設計をやめる
・公的書類を完全にデジタル化(機械が読み取りやすいデジタルデータに)する
など、人間中心の社会を止める必要があると思うが、もちろんそんな事は不可能なのでAI(笑)はほとんどの職種で普及しないと思う。


原理的に100%の精度を求められていない業務(トランザクションレンディングにおけるスコアリング)や、後から訂正すればOKな業務(些末なネット記事作成)には導入され普及するだろうが。