2014年の創業から成長を続けるAI系スタートアップ、株式会社オルツ(以下、オルツ)。
AIクローン「P.A.I.®(パーソナル人工知能)」の開発や、会議をリアルタイムに文字起こしできるソリューションサービス「AI GIJIROKU(AI議事録)を展開している。
2021年には「AI GIJIROKU」の建築・建設業界版である「建築GIJIROKU」をリリース。ソリューションの特徴から会社が掲げるビジョンまで、同社の事業企画部 部長 浅井勝也氏にうかがった。
ーー 会議をリアルタイムで文字起こしする「AI GIJIROKU」は、精度が高いのも特徴のようですね。具体的にはどのようなソリューションなのでしょうか。
浅井:「AI GIJIROKU」は2020年にローンチして伸びてきたソリューションです。例えばGoogleなどの汎用的な音声認識エンジンでは、一般的な言葉の認識率は高くても業界用語になると認識できません。
しかし、「AI GIJIROKU」では「建築 GIJIROKU」「物流GIJIROKU」「医療GIJIROKU」といったように、業界ごとに音声認識エンジンのモデルを作って学習させているので、各業界の専門用語を認識し正しく記録できます。
さらにアカウントごとに、よりパーソナライズされた情報を学習させることができるのも「AI GIJIROKU」の強みですね。
ーー パーソナライズされた情報とはどういったことでしょう?
浅井:まずは個々の「声紋」を登録します。指定された2、3行の文章を読み上げるだけで、簡単に自分の声が登録できる仕組みになっています。
精度を上げるためには、間違えてしまう言葉を「辞書機能」で登録したり、間違った文章を手動で修正したりすることで自動的にデータが蓄積されていきます。
さらにアプリ連携で、自分のメールやSNSなどのアカウントから、会社名やお客様の名前などの固有名詞を学習させて、よりパーソナライズすることができます。こうやって、一般的な音声認識に加え、業界別×パーソナライズでどんどん精度を上げていけるのが、「AI GIJIROKU」の特長です。
ーー 似たような文字起こし・議事録サービスも増えてきていますが、声紋認識などパーソナライズ化できるのは大きいですね。
浅井:はい。もちろん、つねに新しい言葉は出てきます。例えば「コロナ」も3年以上前はほぼ存在しない言葉でしたよね。
2020年時点で「コロナにかかった」と出てきた時に「コロナって何だ?」「ビールのコロナ?」となるわけです。文脈の中で、この単語はその人にとってどう変換されるかを、そのつど学習していきます。
ーー 自分のクセのような部分も含め、前後の文脈も鑑みて音声認識がされるんですね。
浅井:おっしゃる通りです。また、会議で複数人が喋っても、アカウントごとに声紋登録して声を紐付けられるので、どの声が何を喋っているかを判別できます。
ーー 建設業界にフォーカスした「建築GIJIROKU」は、どんな方に使われているのでしょうか。
浅井:「建築GIJIROKU」はディベロッパーからゼネコンなどの大企業から、一人親方などの個人事業主の方まで、建設業界の多くのお客様にご利用いただいています。
今、このようなソリューションは建設業界からニーズが高く、類似する様々なサービスを比較検討した上で、「建築GIJIROKU」を選ばれるお客様も多いですね。
議事録の即時性はもちろん、やはり建設業界の専門用語が反映できることにご満足いただいているようです。
ーー どんな目的で使われることが多いのでしょう?
浅井:もともと建設業界の方が感じている課題は二つあると思っています。一つ目は、紙ベースの議事録で「生の声」が残ってないこと。
取引先と「言った、言わない」という問題になった時には実際の音を聞かないと判断ができないから、トラブルを回避するためにエビデンスを残す目的で使われている方は多いですね。
ーー なるほど。
浅井:二つ目は、業務簡略化のニーズ。建設業界でも「2024年問題」が取り沙汰されていますが、働き方改革に伴って労働時間の上限規制などが2024年に施行されるため、業務効率化できる部分は作業時間を減らす必要があります。
例えば、会議が18時に終わって、そこから人が議事録を起こすと何時間も残業することになりますが、リアルタイムで議事録ができれば残業することもありません。業務改善したいという危機意識や熱量が高いほど、このソリューションが刺さると。
加えて、今は外国から来た技術者や研修生も多いので、現場のコミュニケーションで同時通訳として使っているケースもありますね。専門用語でも日本語のニュアンスを伝えられますから。
ーー 今後、AI GIJIROKUはどんなアップデートをされていくのでしょうか?
浅井:会議室では精度高く音声がとれても、屋外の建設現場になると、「音がうまく拾えていない」「外部の余計な騒音が入ってしまう」と言われることもあります。
それをクリアするために今、NTT-AT様と実証を進めているのが「AI GIROKU MAX」(※ 参考:https://alt.ai/news/news-1747/)です。
これは、NTT-AT様が商用化した12方向分離マイクロフォンモジュールとオルツの「AI GIJIROKU」を連携させた新ソリューションで、ひとつのデバイスで6話者までの集音が可能になっています。複数人が同時に発話をした場合でも90%以上の精度を記録しています。
ーー すごい。話し手を高精度で認識してくれたら、使い勝手はますます向上しますね。他にも新機能があれば教えていただきたいです。
浅井:かねてからお客様のご要望として多かった「清書機能」を2023年3月1日にリリースしました。この「清書機能」は「AI GIJIROKU」が書き起こした議事録から清書版(完成版)の議事録作成をサポートしてくれる機能です。
「清書機能」には、「AI要約機能」「ブックマーク機能」「議題機能」「自由メモ機能」を実装しています。
各機能の詳細説明は割愛しますが、「AI要約機能」を活用すれば、サマリーの作成をAIが支援してくれたり、「ブックマーク機能」を使えば、会話の重要箇所だけを一元的にブックマークできたりと、従来の「AI GIJIROKU」では叶わなかった、第三者が見てもわかりやすく、整理された「議事録」がスピーディに作成できるようになっています。
―― 「AI GIJIROKU」ならではの機能ですね!構想段階でも構いませんので、他にもありますか?
浅井:これもお客さまからのご要望が多いのですが「アナリティクス機能」ですね。例えば、誰がどれくらい発言したか、その会議がどれくらい活性化されているかなど、会議の生産性を可視化できればと。
一般的に「生産性のある会議」と言われるものは、アジェンダに対してちゃんとその議論がされたかということと、ネクストアクションが明確になったかだと考えます。ですので、そこが評価基準になるかと思います。
管理監督者や上の立場の人が、全ての会議をチェックできるわけではないので、AIが定量的にデータ化したり、スコアリング化したりできるとよいですよね。
ーー 将来的には、人事評価にも使える可能性もありそうですね?
浅井:まさにそうですよね。あとは、コンプライアンスの観点でも可能性があります。例えば、1on1ミーティングで上司からパワハラやセクハラ的なワードが出たら内部通報されたり、コールセンターのクレームをテキスト化して「NGワード」を判別し、いち早くアラートを出すなど、可能性は広がっています。
ーー 今後のオルツのビジョンもおうかがいできますか?
浅井:私たちが開発しているAIクローン「P.A.I.(パーソナル人工知能)」を普及させていくことが、大きなミッションです。
例えば、昔はアニメ「パーマン」なんかでは、コピーロボットといって、自分の物理的なコピーを作ってましよね。オルツの「P.A.I.」はデジタル上で自分のコピーを再現する試みをしています。
北米では「ワトソン」という「全知全能のAI」を作ろうとしてますが、オルツでは逆の発想で、個人のパーソナリティに寄り添ったAIを作ろうと。将来的には、一人ひとりが1つのP.A.I.を持てるようになるのが目標です。
ーー個々に「P.A.I.」が持てることで、どんなことが可能になるんでしょうか?
浅井:「P.A.I.」は、自分の思想を学習させて自分の意思を反映します。
ですので、例えば日程調整などのメールのやり取りや資料データの送付、ECサイトでの買い物代行など、自分の代わりにあらゆるデジタル上のタスクを自動的に行ってくれるようなイメージです。
映画「マトリックス」のように、自分の意思を持ちながらもう一つの世界で生きているような。
ーー 自分でいちいちコントロールするのではなく、P.A.I.がデジタル上で勝手に考えて動いていくと。
浅井:はい。そのようなコンセプトを軸に「AI GIJIROKU」などの個々のソリューションがあるんです。
私たちの様々なソリューションはオルツ IDで連携し、プラットフォームになっていきます。「AI GIJIROKU」で学習されたデータが他のソリューションに引き継げてデータが蓄積され、そのデータがP.A.I.の基礎となる。単なる一つのソリューションではなく、そんなストーリーがあります。
そして、P.A.I.の先には「ラボーロ(労役)からオペラ(アーティスティックな営み)へ」というビジョンがあります。パーソナルAIが自分の代わりにタスクをこなすことで、人間である自分自身は本質的に重要な仕事に集中できる。そんな世界を目指しています。
ーー なるほど。大きなビジョンが根幹にあると。
浅井:あと、P.A.Iはデジタル上に自分の命を永遠に残せるという側面もあります。
人類の資産と言うとちょっと大げさかもしれませんが、亡くなった人のデータがデジタル上に残っていればP.A.Iができてその人のケイパビリティや能力を引き継げますし、身近なところでは家族の思い出も残せますよね。
ーー 今、建設業界では優れた技術を持つ職人さんの高齢化が進み、若手も人材不足で技術を引き継げないという問題がありますが、技術継承にこのP.A.I.は有効でしょうか。
浅井:職人さんのP.A.I.があれば、技術継承にも役立ちますよね。実はJR西日本様からも属人的な技術をAI化したいと要望があり、それに取組んでいる最中です。
例えば鉄道会社では、事故が起こるとダイヤをすぐに調整しないといけませんが、それも今はデジタルではなくて、ベテランの司令員が経験値と感覚で線を引いてダイヤグラムを作っている。
新人も横について学びながらその技術継承しているんです。今、残っている手書きの膨大なダイヤグラムから検証を進めています。
ーー これまで“見て覚える”だった技術継承が、見える化されるのはすごいですね。
浅井:職人さんの経験とカンで技術が継承されていたところを、いかにデジタル化するか。これは、建設現場も同じではないかと思っています。うまくいけば、今まで人間がやっていたアナログなスキルをデジタルで継承し、負担も大きく軽減できますよね。
【編集部 後記】
2022年に脳科学者・茂木健一郎氏のAIクローンの生成に成功するなど、大きな話題を呼ぶスタートアップ、株式会社オルツ。一人ひとりのAIクローンが世界に広がる世界へと、前進を続けている。
ソリューションの一つである「AI GIJIROKU」は、導入企業が2022年8月時点で6,000社を突破。建設業界でも「建築 GIJIROKU」の導入が進み、業務効率化や生産性向上はもちろんのこと、人事評価から、コンプライアンスまで可能性が広がっているという。そして、AIクローンは技術継承にも有効だというから、これからの発展が楽しみだ。
株式会社オルツ
東京都港区六本木7-15-7 新六本木ビル (SENQ六本木 807)
WEBサイト:https://alt.ai/
AIクローン「P.A.I.®(パーソナル人工知能)」の開発や、会議をリアルタイムに文字起こしできるソリューションサービス「AI GIJIROKU(AI議事録)を展開している。
2021年には「AI GIJIROKU」の建築・建設業界版である「建築GIJIROKU」をリリース。ソリューションの特徴から会社が掲げるビジョンまで、同社の事業企画部 部長 浅井勝也氏にうかがった。
音声認識 ✕ 業界別 ✕ パーソナライズで、高精度に
ーー 会議をリアルタイムで文字起こしする「AI GIJIROKU」は、精度が高いのも特徴のようですね。具体的にはどのようなソリューションなのでしょうか。
浅井:「AI GIJIROKU」は2020年にローンチして伸びてきたソリューションです。例えばGoogleなどの汎用的な音声認識エンジンでは、一般的な言葉の認識率は高くても業界用語になると認識できません。
しかし、「AI GIJIROKU」では「建築 GIJIROKU」「物流GIJIROKU」「医療GIJIROKU」といったように、業界ごとに音声認識エンジンのモデルを作って学習させているので、各業界の専門用語を認識し正しく記録できます。
さらにアカウントごとに、よりパーソナライズされた情報を学習させることができるのも「AI GIJIROKU」の強みですね。
ーー パーソナライズされた情報とはどういったことでしょう?
浅井:まずは個々の「声紋」を登録します。指定された2、3行の文章を読み上げるだけで、簡単に自分の声が登録できる仕組みになっています。
精度を上げるためには、間違えてしまう言葉を「辞書機能」で登録したり、間違った文章を手動で修正したりすることで自動的にデータが蓄積されていきます。
さらにアプリ連携で、自分のメールやSNSなどのアカウントから、会社名やお客様の名前などの固有名詞を学習させて、よりパーソナライズすることができます。こうやって、一般的な音声認識に加え、業界別×パーソナライズでどんどん精度を上げていけるのが、「AI GIJIROKU」の特長です。
ーー 似たような文字起こし・議事録サービスも増えてきていますが、声紋認識などパーソナライズ化できるのは大きいですね。
浅井:はい。もちろん、つねに新しい言葉は出てきます。例えば「コロナ」も3年以上前はほぼ存在しない言葉でしたよね。
2020年時点で「コロナにかかった」と出てきた時に「コロナって何だ?」「ビールのコロナ?」となるわけです。文脈の中で、この単語はその人にとってどう変換されるかを、そのつど学習していきます。
ーー 自分のクセのような部分も含め、前後の文脈も鑑みて音声認識がされるんですね。
浅井:おっしゃる通りです。また、会議で複数人が喋っても、アカウントごとに声紋登録して声を紐付けられるので、どの声が何を喋っているかを判別できます。
「エビデンスを残したい」「社内の働き方改革を進めたい」。高まる土木・建設業界でのニーズ
ーー 建設業界にフォーカスした「建築GIJIROKU」は、どんな方に使われているのでしょうか。
浅井:「建築GIJIROKU」はディベロッパーからゼネコンなどの大企業から、一人親方などの個人事業主の方まで、建設業界の多くのお客様にご利用いただいています。
今、このようなソリューションは建設業界からニーズが高く、類似する様々なサービスを比較検討した上で、「建築GIJIROKU」を選ばれるお客様も多いですね。
議事録の即時性はもちろん、やはり建設業界の専門用語が反映できることにご満足いただいているようです。
ーー どんな目的で使われることが多いのでしょう?
浅井:もともと建設業界の方が感じている課題は二つあると思っています。一つ目は、紙ベースの議事録で「生の声」が残ってないこと。
取引先と「言った、言わない」という問題になった時には実際の音を聞かないと判断ができないから、トラブルを回避するためにエビデンスを残す目的で使われている方は多いですね。
ーー なるほど。
浅井:二つ目は、業務簡略化のニーズ。建設業界でも「2024年問題」が取り沙汰されていますが、働き方改革に伴って労働時間の上限規制などが2024年に施行されるため、業務効率化できる部分は作業時間を減らす必要があります。
例えば、会議が18時に終わって、そこから人が議事録を起こすと何時間も残業することになりますが、リアルタイムで議事録ができれば残業することもありません。業務改善したいという危機意識や熱量が高いほど、このソリューションが刺さると。
加えて、今は外国から来た技術者や研修生も多いので、現場のコミュニケーションで同時通訳として使っているケースもありますね。専門用語でも日本語のニュアンスを伝えられますから。
ーー 今後、AI GIJIROKUはどんなアップデートをされていくのでしょうか?
浅井:会議室では精度高く音声がとれても、屋外の建設現場になると、「音がうまく拾えていない」「外部の余計な騒音が入ってしまう」と言われることもあります。
それをクリアするために今、NTT-AT様と実証を進めているのが「AI GIROKU MAX」(※ 参考:https://alt.ai/news/news-1747/)です。
これは、NTT-AT様が商用化した12方向分離マイクロフォンモジュールとオルツの「AI GIJIROKU」を連携させた新ソリューションで、ひとつのデバイスで6話者までの集音が可能になっています。複数人が同時に発話をした場合でも90%以上の精度を記録しています。
ーー すごい。話し手を高精度で認識してくれたら、使い勝手はますます向上しますね。他にも新機能があれば教えていただきたいです。
浅井:かねてからお客様のご要望として多かった「清書機能」を2023年3月1日にリリースしました。この「清書機能」は「AI GIJIROKU」が書き起こした議事録から清書版(完成版)の議事録作成をサポートしてくれる機能です。
「清書機能」には、「AI要約機能」「ブックマーク機能」「議題機能」「自由メモ機能」を実装しています。
各機能の詳細説明は割愛しますが、「AI要約機能」を活用すれば、サマリーの作成をAIが支援してくれたり、「ブックマーク機能」を使えば、会話の重要箇所だけを一元的にブックマークできたりと、従来の「AI GIJIROKU」では叶わなかった、第三者が見てもわかりやすく、整理された「議事録」がスピーディに作成できるようになっています。
―― 「AI GIJIROKU」ならではの機能ですね!構想段階でも構いませんので、他にもありますか?
浅井:これもお客さまからのご要望が多いのですが「アナリティクス機能」ですね。例えば、誰がどれくらい発言したか、その会議がどれくらい活性化されているかなど、会議の生産性を可視化できればと。
一般的に「生産性のある会議」と言われるものは、アジェンダに対してちゃんとその議論がされたかということと、ネクストアクションが明確になったかだと考えます。ですので、そこが評価基準になるかと思います。
管理監督者や上の立場の人が、全ての会議をチェックできるわけではないので、AIが定量的にデータ化したり、スコアリング化したりできるとよいですよね。
ーー 将来的には、人事評価にも使える可能性もありそうですね?
浅井:まさにそうですよね。あとは、コンプライアンスの観点でも可能性があります。例えば、1on1ミーティングで上司からパワハラやセクハラ的なワードが出たら内部通報されたり、コールセンターのクレームをテキスト化して「NGワード」を判別し、いち早くアラートを出すなど、可能性は広がっています。
デジタル上に、もうひとりの自分を再現。AIクローンP.A.Iが、技術継承にも役立つ
ーー 今後のオルツのビジョンもおうかがいできますか?
浅井:私たちが開発しているAIクローン「P.A.I.(パーソナル人工知能)」を普及させていくことが、大きなミッションです。
例えば、昔はアニメ「パーマン」なんかでは、コピーロボットといって、自分の物理的なコピーを作ってましよね。オルツの「P.A.I.」はデジタル上で自分のコピーを再現する試みをしています。
北米では「ワトソン」という「全知全能のAI」を作ろうとしてますが、オルツでは逆の発想で、個人のパーソナリティに寄り添ったAIを作ろうと。将来的には、一人ひとりが1つのP.A.I.を持てるようになるのが目標です。
ーー個々に「P.A.I.」が持てることで、どんなことが可能になるんでしょうか?
浅井:「P.A.I.」は、自分の思想を学習させて自分の意思を反映します。
ですので、例えば日程調整などのメールのやり取りや資料データの送付、ECサイトでの買い物代行など、自分の代わりにあらゆるデジタル上のタスクを自動的に行ってくれるようなイメージです。
映画「マトリックス」のように、自分の意思を持ちながらもう一つの世界で生きているような。
ーー 自分でいちいちコントロールするのではなく、P.A.I.がデジタル上で勝手に考えて動いていくと。
浅井:はい。そのようなコンセプトを軸に「AI GIJIROKU」などの個々のソリューションがあるんです。
私たちの様々なソリューションはオルツ IDで連携し、プラットフォームになっていきます。「AI GIJIROKU」で学習されたデータが他のソリューションに引き継げてデータが蓄積され、そのデータがP.A.I.の基礎となる。単なる一つのソリューションではなく、そんなストーリーがあります。
そして、P.A.I.の先には「ラボーロ(労役)からオペラ(アーティスティックな営み)へ」というビジョンがあります。パーソナルAIが自分の代わりにタスクをこなすことで、人間である自分自身は本質的に重要な仕事に集中できる。そんな世界を目指しています。
ーー なるほど。大きなビジョンが根幹にあると。
浅井:あと、P.A.Iはデジタル上に自分の命を永遠に残せるという側面もあります。
人類の資産と言うとちょっと大げさかもしれませんが、亡くなった人のデータがデジタル上に残っていればP.A.Iができてその人のケイパビリティや能力を引き継げますし、身近なところでは家族の思い出も残せますよね。
ーー 今、建設業界では優れた技術を持つ職人さんの高齢化が進み、若手も人材不足で技術を引き継げないという問題がありますが、技術継承にこのP.A.I.は有効でしょうか。
浅井:職人さんのP.A.I.があれば、技術継承にも役立ちますよね。実はJR西日本様からも属人的な技術をAI化したいと要望があり、それに取組んでいる最中です。
例えば鉄道会社では、事故が起こるとダイヤをすぐに調整しないといけませんが、それも今はデジタルではなくて、ベテランの司令員が経験値と感覚で線を引いてダイヤグラムを作っている。
新人も横について学びながらその技術継承しているんです。今、残っている手書きの膨大なダイヤグラムから検証を進めています。
ーー これまで“見て覚える”だった技術継承が、見える化されるのはすごいですね。
浅井:職人さんの経験とカンで技術が継承されていたところを、いかにデジタル化するか。これは、建設現場も同じではないかと思っています。うまくいけば、今まで人間がやっていたアナログなスキルをデジタルで継承し、負担も大きく軽減できますよね。
【編集部 後記】
2022年に脳科学者・茂木健一郎氏のAIクローンの生成に成功するなど、大きな話題を呼ぶスタートアップ、株式会社オルツ。一人ひとりのAIクローンが世界に広がる世界へと、前進を続けている。
ソリューションの一つである「AI GIJIROKU」は、導入企業が2022年8月時点で6,000社を突破。建設業界でも「建築 GIJIROKU」の導入が進み、業務効率化や生産性向上はもちろんのこと、人事評価から、コンプライアンスまで可能性が広がっているという。そして、AIクローンは技術継承にも有効だというから、これからの発展が楽しみだ。
株式会社オルツ
東京都港区六本木7-15-7 新六本木ビル (SENQ六本木 807)
WEBサイト:https://alt.ai/
WRITTEN by
建設土木の未来を
ICTで変えるメディア