AI&HPC Convergence Frontline
![]() |
AI&HPC融合最前線 第1回 AIを事業に一早く取り込む 株式会社ロゼッタ
![]() |
株式会社ロゼッタで人工知能を使った機械翻訳に取り組むメンバー:(左から)SI本部 principal Engineer 川原 宏太さん、SI事業部 赤坂 彰さん、開発本部 渡辺 秀行さん、SI本部 本部長・執行役員CSO、木村 浩康さん |
IDCの調査報告によると、2018年における国内のAI市場は前年比91.4%増しの532億円で今後2023年までの年間平均成長率が53.4%で、2023年には市場サイズは3,578億円に達すると予測している。ただ2018年の532億円とは、このAIブームにしては少し小さい感じがするのは筆者だけであろうか? この内訳はハードウェアが142億円、AIシステム構築のためのコンサルティングなどのサービスが200億円、そしてAI関連のソフトウェアで191億円となっているそうだ。では、実際にAIを使った事業ではどうなっているのだろうか?本「HPC&AI融合最前線シリーズ」では、HPCとAIの融合がどの程度進み、実際にどのような成果がもたらされているのかを見ていきたいと思う。
第一回目は、AIを早くから事業展開し、AIを使った機械翻訳サービスでは国内シェアトップである株式会社ロゼッタを紹介する。ロゼッタ社は元々、1998年に創業した翻訳事業を行う会社から始まっている。まだAIが冷遇されていた2004年に五石代表の決断でAIによる機械翻訳事業を開始するためにロゼッタ社を始めている。そしていくつもの改良を重ねて、いまでは機械翻訳の日本におけるシェアトップとなったのだ。
人間翻訳から発展
その生い立ちについて、木村氏と渡辺氏は「IR情報を見ていただけるとわかるかと思いますが、ロゼッタはいまでこそ、AI翻訳の会社と認知されていますが、ロゼッタグループとしては、AI翻訳事業は数年前までグループ会社全体の1割ほどの事業規模で、そのほかは、人手で行う翻訳事業に強みを持つ言語ソリューションカンパニーでした。」
木村氏「もともとAI翻訳、ディープラーニングを使わないAIといったものはやってはいたのですが、GPUを使った研究を本格的に始めたのは私が入社した時からです。」
渡辺氏「AI翻訳といってもAIというのは何種類かあって、そのうちの一つに機械学習というのがありますが、機械学習の中でもGPUとかを使う必要があるディープラーニングの機械学習とディープじゃない機械学習があるわけですね。ディープじゃない機械学習の翻訳としては、当時は統計翻訳というのがありまして、それを主にしていました。」
渡辺氏「最初の最初はルールベースといって、こういう構文が来たらこういう翻訳ですよというようなものでした。たくさんの山のような規則をずらっと並べて、規則とマッチする文が出てきたら規則の通りに翻訳します。英語のテスト勉強で、単語だけがいくつか置き換わった文章を作るような練習問題があると思うのですけれど、それの応用みたいな感じのルールベースというのがあって、その後 統計翻訳というのが出てきて、その後にディープラーニングになったのです。」
現在の開発とプラットフォーム
GPUを用いた開発は当初、木村氏を始めとする数名でスタートし、いまでは数十名が複数のチームに分かれ、ニューラルトラスレーションのマシンラーニングの研究や、その基盤作りを担当しているとのことだ。
同社ではこのAI機械翻訳サービスをWebサービスとして提供しており、利用者はWebサービスに翻訳したいドキュメントを投入することでサービスを受けることができる。サービスを提供しているサーバは電力や空調でGPUサーバ設置に強みをもつデータセンターに設置されており、デル社製Power Edge C4140サーバが数十台活躍している。Power Edge C4140サーバは1Uの筐体ながら最大4基のNVIDIA Tesla V100を搭載することが可能だ。同社では数十台のマシンに搭載された数百枚のGPGPUでサービスを提供している。すべてが翻訳サービスに提供されているのではなく、学習用と翻訳用の用途に分かれて運用されているそうだ。
2,000分野の専門辞書をベースに顧客毎にカスタマイズ
HPCwire Japanでも翻訳を日常的に行っているが、翻訳にとって一番重要なのは辞書だ。辞書は1冊ですべての翻訳ができる訳ではない。業界毎に専門用語が異なるし、さらには企業毎の用語も存在する。一般的な翻訳ソフトでは各ユーザが自分で辞書を構築していかなければならない。ロゼッタ社が開発した「T-4OO」はそんな手順を人工知能がやってくれる。ロゼッタ社では専門分野毎に2,000種類の辞書を持っている。ユーザは翻訳対象毎に辞書を選択することができるし、さらには自分なりの辞書を構築していくことも可能だ。
「例えば、医学と一言で言っても、癌なのか、皮膚科なのか、泌尿器科なのかみたいに、いろんな業界でお客様が翻訳したい分野というのが異なり、結構皆さんニッチなんです。その分野に最適化された翻訳エンジンというのは世の中どこにもないんです。一般用途で言えばGoogle翻訳というエンジンがあるし、Office系だったらマイクロソフトのトランスレーターがありますが、お客様が欲しいのは一般用ではなくて、業務上で翻訳が必要な場合があります。もともと人の翻訳でも分野別に分かれています。金融の翻訳が得意な人は医学論文を翻訳できません。当社の翻訳システムでは、人間翻訳で必要とされてきたものを採用してきているのが一つ大きな特徴です。」と赤坂氏が説明してくれた。
![]() |
さらに赤坂氏は、「翻訳する際に、辞書データベースに何を使うかを、当社が構築している2,000分野の辞書データから選択し、さらにお客様が自分たちはこういう風に翻訳したいというお客様の固有のデータベースを構築することで、この2つのデータベースの掛け算というか組み合わせで翻訳の自動化を成し遂げているのです。」と強調している。
またこの商品名である「T-4OO」の意味について、「これ実は「400(四百)」じゃなくて「OO(オーオー)」なんです。「Translation for Onsha Only」の頭文字で、御社オンリーという意味なのです。」と渡辺氏が付け加えてくれた。
人間翻訳を凌駕する機械翻訳を目指し常にレベルアップ
この「T-4OO」は翻訳精度と品質を上げるために実は常にアップデートされている。ロゼッタ社では定期的ではないが、常に良質な翻訳を提供するために様々な学習手法やデータを使ってモデルを作成している。木村氏は次のように説明してくれた。「機械学習、機械翻訳、ディープラーニング、AI系における課題は、そもそも作られるモデル自体の品質というのがブラックボックスになっていることです。トレーニングデータに対して行われるので、マシンリソースを大量に投入して大量にモデルをいっぱい作って、その中で一番良いものを選ぶということをしなければ現状のAIとしては成り立たないのです。」
ロゼッタ社では新しくできる翻訳モデルを最終的に人が翻訳したものと比較し、その精度が以前よりも高くなければ、そのモデルは採用せずに次のモデルを試すということを繰り返して翻訳の品質と精度を上げている。カタログに掲載された精度は95%とあり、これは正解(翻訳の)に対しての精度だそうだ。
ロゼッタ社では翻訳の速度より翻訳精度に重点を置いている。「1秒で翻訳されて手直しに30分かかるよりも、自動翻訳に5分掛かるけれども5分でチェック終了するほうが、価値が高いと思っています。」と赤坂氏は説明してくれた。
![]() |
目標を明確化することでAIを収益化
インタビューの最後に今のAIブームについて聞いてみた。
木村氏「国内とグローバルでだいぶ違うと思います。今のAIを専業にしている企業を見てみると、なかなかアウトプットが出てきていないのが現実です。何か結果をだしても、それを商業ベースまで持っていけていないのが日本の不幸なところだと思います。GoogleとかAmazon、マイクロソフトにしても、ちゃんとお金をマネタイズというか、使えるものとして出せているというのは非常にすごいと思っているのですが、国内はちょっと全然です。」
「それはたぶんアウトプットを意識しているかどうかの違いだと思います。何でビジネスを起こすか。弊社の場合は、マシントランスレーションで翻訳業界を全部塗り変えるという五石の目標があったから。それはわかり易かったです。私たちが入社する際にそれを聞いて、たぶんそれが大きかったかなと思います。」
木村氏:「夢があるのは楽しいですが、研究を聞いているとすごく楽しくて自分も好きなのですけれども、それが何に使える、何が良くなるかと言うと、やっぱり実際に良くなったのを見せている会社と、そうではない会社の二極化が進んじゃっているのかなと思います。日本の場合はそもそも市場がそんなに大きくないので、私も国プロをやっていたのですけども、そこでいろいろ関わってきて思うのは、やっぱりビジネスまで持っていける研究ってほとんどないので、ちょっとそこはもったいないなというのを感じています。」
AIで事業を成功するにはAIを取り入れた世界を明確に示すビジョンが必要なのだろう。そういう意味では明確な目標と共に、中核事業にAI技術を完全に取り込んで成功するロゼッタ社。今後は音声認識も取り込んで機械翻訳を行う計画があり、さらに計算処理量は増える一方だ。
ロゼッタ社はAI的に恵まれた環境にあったのかもしれない。人間翻訳による過去の蓄積があり、それをAI的に利用できる技術者が存在し、そして出てきた結果を評価する専門家がいたのだ。この3本の柱が正しく機能したことがロゼッタ社のAI的成功の鍵と言える。