テープ起こしは誰でもできる

 テープ起こしは誰だってできる。料理や皿洗いが誰だってできるのと同じだ。私だって、東京で一人暮らしを始めた時点から数えればもう20年以上、ご飯を作り、お皿を洗っている。
 だが、料理を仕事としてお金を稼ごうとすれば、私では到底つとまらない。皿洗いだって実は向き不向きがあり、上手下手があり、続く人と続かない人がいる。

 テープ起こしも、日本人が日本語を聞き取って入力するのだから、1万8,000字(音声1時間分の平均文字数。実際は音声によってかなりバラつきがある)のうち1万7,000字程度は、誰が起こしても同じになるだろう。
 私は、仕事が重なったときは一部を誰かに頼む。だけど誰でもいいというわけにはいかない。1,000字も間違っていたら、後のチェック・修正にかかる時間はすさまじく、自分で起こすより手間がかかるほどなのだ。

 1万8,000字のうち20字程度直せば納品できる、卓越したテキストを作る人というのはちゃんといる。
 その20字も、音声の聞き取りにくい部分を、違う耳で聞いたことで私がたまたま聞き取れた、という程度のことだ。あるいは、私はそのクライアントからの仕事を継続して受注しているから、音声に出てくる特殊な業界用語を知っていたとか。

 そういうすごい人には、できるだけ直接会って取材するようにしている。今度のセミナーでは、取材で探り出したテープ起こしの練習方法なども話したいと思っている。

2007.09.12

テープ起こしは誰の仲間か

 

 入力系の仕事を「データ入力系」「テープ起こし系」と大きく2つに分けると…。
 と書いていつも思うのだが、テープ起こしに携わる人たちは「自分は入力者である」とか「入力系の仕事をしている」とは捉えていないかもしれない。

テープ起こしという仕事を分類すると?
・入力者(紙の原稿を入力する入力者)に近い
・文章を作るという点でライターに近い
・書類作成業として、むしろ事務職に近い
・「しゃべり言葉の文字化」として、要約筆記やテレビのテロップ作成などの仲間
・当然「速記」の仲間

 テープ起こしは文章力がないと務まらないから、ライターと掛け持ちしている人は多い。また、社内の会議で記録を取ることなどは普通の会社員が普通にやっているから、事務職の延長という感じもする。要約筆記などは福祉系の仕事(専門ボランティア?)だが、テープ起こしに興味を持つ人は要約筆記にも興味を持つタイプなので、両方やっている人はわりといる。
 録音機材が出現して以来、録音した音声から起こすという仕事が可能になったわけで、もともとは速記者というものが存在するだけだった。だから、テープ起こしが速記の仲間というのは当然正しい。

 結局、テープ起こしは上記のどの要素も持っている。その人が請け負う仕事の傾向によって、どの要素が強めに出るかということなのだろう。

 私は入力者でありライターでもある。テープ起こしをするときは、どちらの感覚や知識も動員する。仕事によってどちらを強めに出すかは違うが。
 紙の入力は単価が下落しているし仕事量も不安定なため、優秀な入力者がかなりの人数、テープ起こしに転向した。これも統計がないので数字を挙げての証明はできない。私がよく見聞きするというだけの話だ。

2006.07.30 

「そして」「しかし」安倍首相辞任

 今日はテープ起こしの勉強には絶好のチャンス。安倍首相辞任の会見内容が、文字化されてWebに掲載されている。

 参院選について述べた部分を起こすのに、2社とも「7月の29日」と「の」を入れていることからしても、あんまり整文しない逐語的な起こし方で共通している(整えるときは「7月29日」とするのが普通だと思う)。逐語的なら「、」の入れ方以外はほとんど同じになりそうなものだけど、これがかなり違うのだ。

本日、総理の職を辞するべきと決意をいたしました(毎日新聞)
本日、総理の職を辞すべく決意をいたしました(スポーツ報知)

 なぜだか第一声からして違う。

そしてまた先般、シドニーにおきまして、(毎日新聞)
しかし、また、先般、シドニーにおきまして、(スポーツ報知)

 毎日は意味で「、」を入れていて、スポーツ報知は息継ぎというか声の切れ目で「、」を入れているようだ。でも「そして」と「しかし」では順接と逆接…。実際の発音が「SSっ」というようなものだと、どっちかわからないときはたしかにある。「そして」と起こした人も「しかし」と起こした人も、そう聞き取った根拠があるのだ、たぶん。どんな発声だったのか、7時のニュースで聞いてみよう。
 どう聞き取るか、どう文字化するか、みんなでやってみて発表し合ったら面白いかもしれない。

2007.02.08

国庫金

 さっき面白い郵便物が届いたので、ちょっとその話。
 そっけない圧着ハガキ。「大学かな?」と思った。お盆前、大学の夏期スクーリングに3週間行っていたので、その試験結果の通知に毎日おびえてるのだ。
 でも、「国庫金振込通知書」と書いてある。国庫金って? 振り込め詐欺?

 開けてみて納得。この前、ある中央官庁のテープ起こしをしたのでその振込みだった。はあ、どこの官庁の仕事でも「財務省会計センター」から振り込まれるわけですね。中央官庁から直接に受注したのは初めてだったから、知らなかった。

2008.09.03

「修行」のテープ起こし

 今夜、テープ起こしの仕事が2本入る予定。1本はもう予約してあるけど、もう1本は誰に頼もうか。自分で起こすつもりだったけど、今週は妙に忙しくて。
 録音も悪くて内容も難しい、肩こりがひどくなる仕事だ。不明だらけで全然かまわないからとこちらが言っても、誰の納品メールにもお詫びの言葉が書かれてくる。

 テープ起こしをする者にとって言葉が聞き取れないほど、悔しく情けないことはない。
 あらかじめ状況を説明して、これは不明だらけが普通だからと頼んでいるんだけど、実際に不明だらけになると、本人は傷つく。それがわかるから、こちらも頼みにくい。

 実は私自身も、クライアントに毎度お詫びの言葉を書いて納品していたのだ。
 でも、それだとクライアントも頼みにくくなる。録音は悪い、内容はやたら難しい、だから不明だらけでOKと、クライアントも私に予告したのだから。

 この仕事って一種の修行(←技術を身につける「修業」でなく、悟りを目指して励むような「修行」)だなと、最近は思う。
 自分がどう起こして満足したいかじゃなくて、クライアントが望むものを提供するという切り替え。

 音が悪いのは、審議会の傍聴席から録音しているから。もちろん隠し録りではなく、録音許可を取っているという。だいぶ後になれば正式な会議録が発表されるんだけど、地方の本社に中央の審議会の様子を早く報告するのが、東京事務所の使命だ。
 きっと、傍聴に行く各社は、どこもこうやって努力してるのだろうと思う。正式な会議録はライン録音された音声から作られるのだろうけど、発表を待てない各社が、同じ音声(のもっと悪い版)を、あちこちで苦労してテープ起こししている。

 だから、起こす者としては、不明だらけでもクライアントに貢献しているという自信を持って、にっこり作業して…。そこまで悟りきれないんだけどねー、ホント。今夜入る仕事、どうしよう。

 

殴られる村人

 「ICレコーダーの横で咳をするぞ」と脅されたら、何でも言うことを聞いてしまうだろう。「お代官様っ、それだけはご容赦をー!」

 きのう起こしていた音声が、まさにそれだった。録音機材の近くに、やたら咳をする人がいる。近くの咳というのは、普段の生活ではさほど特別には感じないけど、音声で聞くとすごい爆発音なのだ。
 ヘッドホンをしているから、自分の頭の中で爆発音が響く。「ゲホッ、ゲホッ」というより「ガッ! ガッ!」。
 咳とかぶる部分が聞き取れないのはまあ仕方ない。でも、その前後の音声は起こさなければならないから、何度も同じところを聞く。「ガッ! ガッ!」が来るのはわかっているけど、避けるわけにはいかない。
 なんとか聞き取って先へ進むと、次の「ガッ! ガッ!」がすぐ出てくる。

 お代官様の手下に殴られている、無力な村人になった気分。

 

音声に戻せることは重要か

 テープ起こしの表記は、文字を音声に復元できることを重視して決まっている場合がある。
 例えばよくあるのは、「そのほか」と発音されたら「そのほか」と入力し、「そのた」と発音されたら「その他」と入力するという表記。両方を「その他」と表記しては、元の発音がわからないというわけだ。

 でも、音声に戻せることは大事だろうか。
 起こした文章を普通の人が見たとき、「そのほか」と「その他」が混じっている理由が理解できるだろうか。素晴らしい工夫だと思ってくれるだろうか。

 自分がしゃべるとき、「そのほか」と「そのた」は、意味的な必要があって言い分けているわけではない。前後関係による言いやすさなどで、なんとなく口から出ているだけだと思う。
 だから、「そのほか」を「その他」と表記しても問題ないはず、文章としては「その他」に統一するほうが見た目が美しい、と最近よく思う。

 でも、私が変えれば済むというわけではない。私が仕事を頼んでいる人たちも、当然のこととして使い分けている。納品してもらったファイルをこちらで置換するのと、「ほか」は「他」にしてねと伝えておくるのと、どっちがいいだろう。
 「ほか」以外にも、同じ言葉で同じ意味なのに発音次第で表記を変える慣習になっている言葉はいくつかある。「ほか」をいじるなら、それらもどうするか考えないといけない。

 と考えていくと、おっくうになる。結局「そのほか」→「そのほか」、「そのた」→「その他」を使い続けるほうが楽ということになる。うーん。

 

あのね、驚いたのは、

 メンバーさんから届いたばかりの起こし原稿を読んでいた。まずは音と照らし合わせずに、文字だけを読んでいたのだけど、「あのね、驚いたのは、」という一節があってこちらも驚いた。

 普通のテープ起こしでは、「あのー」「えーと」などはケバとして削除する。だから、この「あのね」も削除されて不思議ではない。
 今回の音声は、たぶんその世界が好きな人にとってはよだれが出るような役者さんが語っている。「あのね」が削除されなかったことで、インタビュアーの問いかけに対して、おそらくちょっと身を乗り出して答える雰囲気が伝わっている。
 「あのね、驚いたのは、」

 テープ起こしを(1)情報内容の伝達を重視してしゃべりの雰囲気は消すべきものと、(2)しゃべりの雰囲気再現を狙うもの…の2種類に分けると、これは後者として絶妙に起こしていると思う。
 かといって、もちろんケバというケバみんな残しては読みにくい。ほとんど整理して、数カ所残してある。うまいなあ。

 

白熱した議論に石焼き芋

 納品してもらった起こしを聞き直し中。音声の中で時刻は夕方。バックに「いーしやーきいもー♪」が通っていく。
 自分の家の外かと思ったけど、やっぱり音声の中だ。教授たちが議論している建物のそばに道路があるらしい。秋だなあ。

 バックの音はいろいろある。
 音声の中で電話が鳴る。自分のところかと錯覚して慌てる。
 音声の中で、エレベーターがその階に着いたときのチャイムが鳴る(会議室がエレベーターホールに近いらしい)。うちのインターホンが鳴ったのかと誤解することがある。

 セミナー用に音声教材を録音するときは、余計な音が入ったらどうしようと結構緊張する。でもたとえ石焼き芋が通ったとしても、「これは実際の音声でもよくあることです」と平然と説明すればいいんだなあ、本当は。

 

夜中のテープ起こしは脳みそが弱くて

 「初歩的」な技術分野と起こしてしまうところだった。正しくは「総合的」な技術分野。単純な聞き間違いだけど、気づいてよかった。初歩的じゃないだろ、この分野は!と自分で突っ込みを入れて、入りそうな言葉を頭で考え直してから聞いたら聞き取れた。
 数日前は、何回聞いても「シー検査」としか聞こえない個所を、深呼吸して意味から考え直したら「立ち入り検査」だった。

 夜中になるともう脳みそが疲れていて、聞こえた言葉を頭で考え直す力が弱くなる。やっぱり午前中は絶好調。

 

このリズムに慣れる

 テープ起こしをする者にとって「聞き取りたい」という欲求、あるいは「聞き取れなければ失格」という呪縛は強い。

 だから、起こしにくい音声を頼むのは怖い。普通の何倍も作業時間をかけたりして、無理をしているんじゃないだろうか。それでも仕上がりはこれなのかと、自分を責めているかもしれない。
 もう廿の仕事はしたくないと思うかもしれない。特にこれから冬になると繁忙期で、私のところ以外だっていくらでも仕事はあるのだから。

 それで、この話題をわざわざオープンなブログで書くことにした。起こしにくい音声の対処法を考えるのは後ろめたいことではないと、自分にも言い聞かせたかったし。並行して、個別のメールでも状況をできるだけ説明した。
 最近、いつもお願いしている方々の納品メールが、以前より楽な感じになってきたように思う。

 録音がよくて、話者が明晰にしゃべっていて、資料も十分に添付されている、そんな音声だったら、聞き取れて当然かもしれない。聞き取れなければ、自分が語彙不足とか、ネット検索が下手とか、資料の読み取りがなってないとか、かもしれない。

 そうでない音声もある。
 ある程度の不明を出さないと起こせない音声というものが、現実に存在する。そう割り切ること、不明の多い起こしの作業リズムに慣れること。私は最近、難聴音声だからといって格別時間をかけていない(だって急ぎなんだもの、この仕事)。

 

25%も落ちがある仕事

 違うクライアントから来た難聴音声の話。
 とにかく録音が遠い。音量を最大近くに上げても大して聞き取れない。ちょっと起こして不明だらけのサンプルを送ったら、これでOKと言われたので作業スタート。
 「不明マークを500個入力し、マークの間にたまたま聞き取れた文字を入力」という難聴音声用の方法。音声は1時間半、粗起こしが終わった段階で、不明マーク800個以上(他に、聞こえたとおりにカタカナで入力したところがある)。文字数1万6000字。

 聞き直しをして、不明マーク645個。文字数は不明マークを含めて1万8000字。
 この話者は、しゃべるスピードが遅いというより間を取るタイプで、たぶん1時間に1万6000字ぐらいのペースだろうと思う。ということは、本当は1時間半なら2万4000字程度あるはずで、6000字が聞き取れていないことになる。
 (こういう音声だと、文字化した部分も正しく聞き取れているという確信は全然ないけど)

  驚いたのは、文字化率わずか75%のデータでも、全体を読んでみるとなんとなく話の大まかな流れは理解できることだ。あとはライターさんにお任せすべく、淡々と納品。

 最近こんな仕事が多いので、普通の録音状態の音声とどう違うか、自分のスタンスはどうあればいいか、だんだんわかってきた。その話はまた次回。

 

文字数を増やす

 音声1時間50分の審議会。粗起こしを終えた段階で不明マーク307個。最初に不明マークを500個も入力してスタートしたが、幸い200個近く余って消した。
 聞き直しで227個に減った。「聞こえたとおりにカタカナ」にしたものを含めても250個程度、このシリーズとしては悪くない。

 「録音状態がよくなく、内容が難しい仕事」をやっていると、不明マークを出すのが怖くなくなる。減らすぞ!と思って聞き直してはいない。増えてもかまわないというつもりで聞き直している。

 なぜなら、私の仕様では「不明マークは文字数に関わらず1カ所に1個」だから。不明マークに●を使うとすると、例えば粗起こしでは「しかし●、●。」というような状態が珍しくない。
 でも一度最後まで起こして、また最初から聞き直す段階では「しかしこれが問題とは●、難しい●が●になったと●ます。」ぐらいまで聞き取れたりする。
 不明2個は4個に倍増だけど、聞き取れた文字は倍増以上だから、当然これは退歩ではなく進歩だ。
 ここまで文字化してあれば、クライアントが聞き取れるかもしれない。違う耳で聞くと分かるときがあるし、クライアントは会議を生で傍聴しているわけだから。

 このシリーズはもう慣れたのでストレスではなくなったが、先週は違うところから来たすごい仕事をやっていた。音声1時間半で、不明600個超。この話はまた次回。

 

議事録を紙1枚にしない理由は?

 議事録について調べている。
 民間企業では、社内会議の議事録は紙1枚にまとめるのが基本で、若手社員が作成を担当する慣習になっているらしい(私も昔やったことがある)。ネット上には、議事録テンプレートとか、議事録の上手なまとめ方とか、「若手は議事録作成で成長する」とかいう解説ページがたくさんある。つまり、民間企業の社内会議の分野には、テープ起こし業者の食い込む余地はないはず。

 ところが。
 私は違う経験もしている。

 「午後に開催される3hの社内会議を夕方遅い時刻に送って、翌日お昼までに起こせないか」という打診を受けたことが。
 こういうあわただしいリクエストをする会社というのは、電話の雰囲気もあわただしい。どうして全文起こしたいのか、聞きたかったけど聞けなかった。
 3h分の全文起こしは5万字を超える長大なデータになり、読みやすいものではないと説明したけど、構わないと言われた。紙1枚にまとめる議事録とは違うニーズが存在しているはずで、そのニーズを知れば何かの仕事に結びつくのではと思うのだけど。

 3時間の音声は、仮に大勢で手分けして一晩で起こしても、それを聞き直してトーンをそろえるだけで4時間以上かかる。翌朝9時にスタートしても午後までかかるし、夜中に作業する人が毎回大勢確保できるとは限らないし、ということでお断りせざるをえなかった。

 全文起こす社内会議は、この断った案件以外にもいくつか経験している。でもそれらは直請けではなかったので、使い道や全文起こした理由は知りようがなかった。民間企業における全文議事録の使い道やニーズについて何かご存じの方、ぜひご一報を。

 

テープ起こしはPTAにも普及していた

 4年ぶりぐらいで小学校保護者会の地区委員になったら、「働いていて平日昼間の地区委員会に出られない人が委員会の書記を務める」という慣習になっていた。
 委員会に出席しないで、どうやって書記の仕事をするかというと。

 なんと、テープ起こしして会議録を作るのだそうだ。

 地区委員会に出てみたら、実際ICレコーダーで録音していた。
 各委員から質問が出ると、「あっ、ちょっと待ってください」と録音担当者がロの字型に並んだテーブルの真ん中へ入る。質問者の近くまで寄ってICレコーダーを向ける。委員長が答えるときは、役員席へ寄ってICレコーダーを委員長に向ける。
 しゃがんだ姿勢のままそれをやるから重労働だけど、置いたままよりずっとよく録音されると思う。

 ちなみに私は、書記その他の役員はまぬがれることができた。