青木元太のひとことブログ

Twitter以上、ブログ未満な内容です。

DeepLエンジン採用。論文も洋書も高精度翻訳するSaaS、開発中!

お知らせ

糖質制限を理想的な栄養バランスで行えるKETONを販売中です。

www.amazon.co.jp/dp/B08726BRK5

Twitter フォローしてね。

https://mobile.twitter.com/keton_boss

 

今日は前にnoteに書いていた、開発中の洋書翻訳サービスをご紹介します。https://note.com/ketonbiz


PDF文章を翻訳しようとしてイライラした経験ないですか?無料のウェブサイトだと容量の制限があるし、精度は低いですよね。一方、大金を払って翻訳者に依頼する程でもない。そんなニーズに対応して作っています。


僕が開発するのは高精度で翻訳できる月額課金型の翻訳サービスです。ポイントは2つ、高精度のOCR加工と、高精度翻訳のDeepLエンジンの採用です。この2つで現時点で最高の翻訳システムが出来上がると確信しています。

 

DeepL翻訳をシステムに組み入れた洋書・論文翻訳サービスです。ざっくりお伝えすると、Amazon等で購入した洋書をPDFファイルにして、サイトにアップロードすると、日本語のPDFファイルが出てくるサービスです。勿論、論文も可能。

 

予定ではSaaS(software as a service)方式です。クラウド上で処理を行うのでスペックが低い端末でも翻訳が可能です。スマホ時代にバッチリのサービスです。アプリをダウンロードする必要もないのも手軽ですよね。

 

イチオシポイント

通常、PDFファイルはWORDの様に編集可能なフォーマットではなく画像です。つまり、PDFファイルの文章を機械が読み取って翻訳することは不可能なのです。

 

しかし、開発するサービスではPDFファイルにOCR加工を施してテキストを機械が読み取れるようにします。OCR加工した上でDeepL高精度翻訳するのでハイクオリティの洋書PDFファイルをアップロードすると日本語PDFファイルが出力できるのです。

 

勿論、PDFの文字抽出の精度が高くないと高精度翻訳できないので、OCR加工にも拘っています。

 

PDFファイルを翻訳するサービスは既にあるのですが、


1. 書籍のような大量のPDFファイルを処理できない

2. DeepLは最近システムに組み込めるようになったので競合は少ない


という問題点があります。

 

この2点が今回開発するサービスと既存サービスの違いです。特に既存サービスは、大量のPDF文章を一度に処理できないことが多いです。他社サービスでは大抵は5MBくらいしかアップロードできません。書籍のPDFは大体100MBくらいなのでちまちま分割してアップロードしなくてはなりません。また、彼らのOCR加工もおまけ程度なので精度はダメダメ。翻訳システムもGoogle翻訳を採用しているの最高とは言い難いです。

 

恐らく、広告費でマネタイズし無料でサービスを提供している為、コスト面からボリュームがある処理をできないのかなと考えています。GoogleでもDeepLでも、僕たちのような開発者に提供する際には「何文字につきいくら」という契約をしています。なので、広告費賄って無料でサービスを提供する場合、一人に沢山の翻訳をされてはビジネスがうまくいきません。つまり、沢山の人に、少しずつ使って貰いたいという方針です。書籍や数十ページある論文の翻訳は想定していないのです。せいぜい数ページの契約書や説明書の翻訳を想定しているのです。

 

一方、僕は月額課金で何ページでも無制限で処理できるサブスクプランを採用するつもりです。きちんとお金を払って貰うことで使い放題を実現します。ちゃんとフリートライアル期間もあるのでどんなもんか試せます。

 

僕のターゲットは大学生や研究者です。大量の英語論文を読み込みたい、内容を把握したい人は嬉しいのではないかと思います。

また、国内未翻訳の書籍をガンガン読んでいきたい僕みたいな人にも是非活用して頂きたいです。

 

今日は以上です。