aws transcribe medical にnature読ましてみる。
目的
AWS Transcribe Medicalなるサービスが発表された様子。
が、Transcribeが元々音声変換サービスなので、なにがどう違うのか、何となくしかわからず。
おおよそ見る限り、臨床用語等に特化して整合性を保った形になるようだ。
ということで、適当にNatureあたりからMedical系の論文漁ってみて変換かけてみたらどうなるか。
というのを実験してみる。患者との会話も範疇にはいっているようなので、
できれば運用の音声のほうがいい気もする。ガチャガチャノイズが入っていたり、色んな人の声が入っているべきだと思う。
今回はそこまで準備できなかった。
記事を音声化する
こちらの記事を使わせていただいた。
https://www.natureasia.com/ja-jp/nm/pr-highlights/13143
https://www.natureasia.com/ja-jp/nm/pr-highlights/13080
本来の用途とは違うだろうから、申し訳ないが。まるっきり違うというわけでもないだろう。
引用云々があるので、テキストをそのまま転写するのは控える。
pollyにテキストを準備する。
pollyの準備はここまで
AWS Transcribe Medicalを用意する
aws transcribe medicalを開く。
1人でしゃべるのでDictationでよいだろう。どうやらリアルタイム変換しかできないようなので、
録音をOnにしてPollyにしゃべらせて拾ってみる。
Let's!
なんかゴリゴリ書いてるー。
全文をPollyに放り込んだのでマイクを持っているのが面倒になった。
文章を短くして再トライ
ほぼほぼ行けてるとおもう。APOE3はアポリポタンパクがどうのこうの。でアルツハイマー(この原文でのメイン)
だろうけど、これがtherrになってしまうか。ふむ。もともとpollyがちゃんと発音できてないかのせいもあるな。
文字からの読み込みで、きれいな音声というのもあるだろうけど他は大体あっている。
次は普通のTranscribeのほうで読み込んでみる。
劇的に変わるとおもったがそれほどでもない。題材がわるかったかなぁ。生きた臨床の録音が必要なきがする。
気がするけどわからないのでもう一本記事をやってみる。
2本目
2本目もやって見たが、やはり大差なし。もともとの認識が強すぎる気もするけど、
やっぱり生きた音声じゃないと差が出ないかな。もっと臨床より、カルテ記述寄りの口語のようなものじゃないと
あんまり意味なさそうだなぁ。というより普通?のTranscribeで問題ないや。という感じか。あとはどれぐらい薬剤名とか、その辺に対応し差別化されてるか。
かなぁ。検査結果とかそー言ったところもありか。やっぱり実際のカルテから音声起こしたほうがいいなぁ。ちょっと無理ですぅ。音声もらえたら
試すのはできるけど。(だれかぁ)