調べ物した結果

現役SEが仕事と直接関係ないことを調べた結果とか感想とか

aws transcribe medical にnature読ましてみる。

目的


AWS Transcribe Medicalなるサービスが発表された様子。
が、Transcribeが元々音声変換サービスなので、なにがどう違うのか、何となくしかわからず。
おおよそ見る限り、臨床用語等に特化して整合性を保った形になるようだ。
ということで、適当にNatureあたりからMedical系の論文漁ってみて変換かけてみたらどうなるか。
というのを実験してみる。患者との会話も範疇にはいっているようなので、
できれば運用の音声のほうがいい気もする。ガチャガチャノイズが入っていたり、色んな人の声が入っているべきだと思う。
今回はそこまで準備できなかった。

記事を音声化する


こちらの記事を使わせていただいた。
https://www.natureasia.com/ja-jp/nm/pr-highlights/13143
https://www.natureasia.com/ja-jp/nm/pr-highlights/13080
本来の用途とは違うだろうから、申し訳ないが。まるっきり違うというわけでもないだろう。
引用云々があるので、テキストをそのまま転写するのは控える。

pollyにテキストを準備する。

f:id:couraeg:20191204004341p:plain
pollyの準備はここまで

AWS Transcribe Medicalを用意する

f:id:couraeg:20191204011357p:plain
aws transcribe medicalを開く。
1人でしゃべるのでDictationでよいだろう。どうやらリアルタイム変換しかできないようなので、
録音をOnにしてPollyにしゃべらせて拾ってみる。

Let's!


なんかゴリゴリ書いてるー。
f:id:couraeg:20191204005450p:plain
全文をPollyに放り込んだのでマイクを持っているのが面倒になった。
文章を短くして再トライ

ほぼほぼ行けてるとおもう。APOE3はアポリポタンパクがどうのこうの。でアルツハイマー(この原文でのメイン)
だろうけど、これがtherrになってしまうか。ふむ。もともとpollyがちゃんと発音できてないかのせいもあるな。
文字からの読み込みで、きれいな音声というのもあるだろうけど他は大体あっている。

次は普通のTranscribeのほうで読み込んでみる。
f:id:couraeg:20191204010216p:plain

劇的に変わるとおもったがそれほどでもない。題材がわるかったかなぁ。生きた臨床の録音が必要なきがする。
気がするけどわからないのでもう一本記事をやってみる。

2本目

2本目もやって見たが、やはり大差なし。もともとの認識が強すぎる気もするけど、
やっぱり生きた音声じゃないと差が出ないかな。もっと臨床より、カルテ記述寄りの口語のようなものじゃないと
あんまり意味なさそうだなぁ。というより普通?のTranscribeで問題ないや。という感じか。あとはどれぐらい薬剤名とか、その辺に対応し差別化されてるか。
かなぁ。検査結果とかそー言ったところもありか。やっぱり実際のカルテから音声起こしたほうがいいなぁ。ちょっと無理ですぅ。音声もらえたら
試すのはできるけど。(だれかぁ)