「東京電力」→「東京電カ」、「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」? 原子力規制庁、サイトを修正 | watch@2ちゃんねる
スポンサーリンク




人気記事(外部)

お勧め記事(外部)

「東京電力」→「東京電カ」、「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」? 原子力規制庁、サイトを修正

スポンサーリンク

1:20世 ★@\(^o^)/ 2014/06/10(火) 14:19:52.31 ID:???0.net

「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」 原子力規制庁、サイトを修正
原子力規制庁がWebサイトで公開している資料の1つで、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼく)と 「口」(くち)になっていると指摘され、同庁が修正する騒ぎがあった。
 原子力規制委員会がWebサイトで公開している資料の中で、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼ く)と「口」(くち)になっていたとネットユーザーに指摘され、サイトを公開している原子力規制庁が修正する騒ぎ があった。画像PDFをテキスト化する際、文字認識(OCR)ソフトが間違った文字を認識してしまったことが原因 という。
誤字があったページ。10日までに修正されている
img1
 誤字があったのは、今年1月に開かれた「第10回特定原子力施設監視・評価検討会汚染水対策検討ワーキ
ンググループ」の会議資料一覧ページ。「福島第一原子力発電所におけるストロンチウム分析の状況について
[東京電力]」という資料の「ト」と「ロ」がそれぞれ漢字になっており、「検索避けのためにあえて漢字にしたので
は」などと一部ネットユーザーの間で騒ぎになっていた。
 同庁によると、Webサイトに掲載するテキストは通常、手打ちで確認しているが、この会議は資料が届いたタイ ミングがギリギリだったため、画像PDFをスキャンし、OCRソフトにかけてテキスト化したものをそのまま貼り付け たという。掲載時に目視で確認したが、「ト」と「ロ」が違うことに気づかずにアップしてしまったという。
 ネットユーザーからの指摘を受け、6月9日に文字を修正。あわせて、同庁サイトのHTMLにほかに同様な 間違い(「キ」と「千」のミス、「力」(ちから)と「カ」(カタカナのカ)のミスなど)がないかチェックしたところ、見つから なかったという。同庁の広報担当者は「こちらのミスで申し訳ない」と話している。
 このほか、「東京電力」や「原子力」の「力」をカタカナの「カ」に変えてGoogle検索すると、関連のPDF資料 が出てくることも話題になった。これらも画像PDFをOCRソフトにかけた際の変換ミスが原因とみられる。
http://www.itmedia.co.jp/news/articles/1406/10/news067.html

 



3:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:21:49.07 ID:aVMY+zrV0.net

姑息すぎるw

50:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:33:53.93 ID:81+purdn0.net

>>3
「姑息」の誤用

 

67:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:38:40.63 ID:5RlBgEBSO.net

>>50
誤用でもない
相当追い詰められてるんだろ

 
4:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:22:11.53 ID:Iy9xk8uW0.net

放射脳はこれすら陰謀だと騒いでたからな
完全にキチガイ化してる


5:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:22:24.34 ID:NOm6+OiQ0.net

そんなクソみたいなOCRソフトねーよ


6:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:23:15.04 ID:doBIst210.net

実は意図的にやりました
スボククチチウム、東京電カ、原子カ


7:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:23:28.18 ID:iArBq7d20.net

また嘘吐いたのか
これで何回目だよw

60:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:36:19.86 ID:P60aBuIu0.net

>>7
むしろ本当の事を何も言ってないでしょw

 
8:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:23:31.15 ID:qOdGY6Oy0.net

テキスト化したものをそのまま貼り付けるだけの簡単なお仕事です。


10:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:23:48.64 ID:ouxqFkXHO.net

どこのソフト使ったんだよ


11:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:23:50.42 ID:po2ufAPj0.net

普通に検索にかからなくしただけだろ


12:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:24:17.82 ID:gRX2A9/O0.net

闇売春サイトかよw


13:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:24:18.05 ID:NVkMmaKX0.net

因縁かよ、放射脳はキチガイすぎ

18:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:11.38 ID:po2ufAPj0.net

>>13
え?いや普通に検索避けだろ
よくあるこういう企業のたしなみだろ
不思議がるほどでもない

 

34:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:28:25.13 ID:Iy9xk8uW0.net

>>18
「ス卜口ンチウム」になっていた文書はストロンチウムの量を過大評価しすぎてましたって内容だったんだけど
これを検索避けにする意味って何?

 
14:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:24:21.27 ID:0znvqCWG0.net

どんなOCRだよ
10年前のだって辞書搭載してるし、そんなミスせんだろ

40:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:31:05.33 ID:Yx6+nbPt0.net

>>14
ろくでもないフリーソフト使ってるとか?
行政で使うPC機材にGOMプレイヤー入れる事例がある位だからさ、
そういう事がないとは言い切れないのが怖いんだわ

 

57:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:35:38.72 ID:Vm+T0YYE0.net

>>40
パナのレッツノートの法人向けモデルなんて、OSリカバリデータに初期アプリとしてGOMプレーヤー入ってたなあw

 

41:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:31:14.14 ID:NNI8bS370.net

>>14
eTypistなんかだと認識間違える時こんな感じだよ。
2chかよ!って突っ込み入れたくなる時も多々ある。

 
16:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:01.31 ID:2+mXjsiI0.net

OCRは意味不明な単語になる間違いはしない。


17:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:07.36 ID:Yx6+nbPt0.net

アウトソーシングで海外に文章起こしでもやらせた結果かと思ったがOCRかよ
どこのOCRソフト使ってるのよ


19:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:11.66 ID:NOm6+OiQ0.net

PDFって文字ひろえるよな?


21:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:25.64 ID:rN4WfZEw0.net

となりの卜卜口


24:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:52.00 ID:CSV4sZ450.net

曰本人として恥ずかしい


30:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:27:08.26 ID:X4UqvONW0.net

トウキョウデンカ?


32:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:28:06.31 ID:NOm6+OiQ0.net

PDFの文書自体は間違ってないのなら
そこから文字コピペするほうが早いだろ。
こんな少ない文字数をわざわざOCRとか普通しないし


35:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:29:20.62 ID:CGFymSc+0.net

担当者ねらーだろw


36:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:29:44.75 ID:/TuqFY6K0.net

こういうことするから疑念を持たれるんだよバカ。


37:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:30:37.77 ID:0B+IXukp0.net

そんなクソ仕様のOCRあるわけねーだろw


39:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:31:03.06 ID:Nw/AbxZs0.net

生産性の低い仕事してんな~
役人なんてこの程度のバカばっかりなんだね


46:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:33:12.28 ID:RJKtdfzU0.net

原子カ(か)ムラ PDFで検索すると首都圏反原発連合とか出てくるんだけど
この人達は何で隠蔽したがってるの?w


52:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:34:24.89 ID:RgaPlwMc0.net

予想通り過ぎの対応
やっぱり検索避けじゃねぇーか


54:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:35:29.93 ID:AqkzKxS7O.net

しかしよくまあ次から次にこういう嘘を考えつくもんだ。


55:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:35:35.61 ID:NtiV4rri0.net

スレタイを10回くらい読み直しちまったじゃねえか


56:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:35:36.69 ID:gRX2A9/O0.net

官僚の天下り先の特殊法人が作ったソフトだな たぶんw


59:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:35:59.08 ID:gng/CaLl0.net

「FFを中国人に作らせたらチョコボがチョコポになってたwww」を思い出した。

コメント

  1. watch@名無しさん より:

    中国や韓国に外注するとよくこういうミスはある。
    まさか・・・・いやいや。わざとだな。

  2. まとめブログリーダー より:

    大阪民国とか修羅の国とかネタにされるけれど、東大とか東電とか『東京』のつく物はガチでヤバいからネタにすら出来ないんだよな…

  3. watch@名無しさん より:

    日本は今日も平和だなぁ~ (-.-)

  4. watch@名無しさん より:

    こういうリトマス紙的なニュースを出して、国民の反応を見てから、深夜とかにこそっと重大な情報を出してきたりしてるからな

  5. watch@名無しさん より:

    普通のOCRソフトだと、かなの間の漢字だから原子と来たら「力(りょく)」を辞書から優先的に持ってくる。まして原子力規制委員会で使用しているなら予め頻繁に使用する単語や専門用語は辞書とうろくさせている筈だ。
    この手のソフト開発に関わった方ならわかると思う、こんな誤変換は絶対有り得ないと。

  6. watch@名無しさん より:

    わざとだとかよく有るとか色々書かれてるけど、これって何か重要な事なの?

  7. watch@名無しさん より:

    この情報公開しても何も反響はないので問題の無い文章と決定事項である言いたいんじゃないの?
    でもばれちゃったね

  8. watch@名無しさん より:

    あのコピペがないってだけで糞スレ

  9. watch@名無しさん より:

    OCRなら普通にこの手のミスはある
    まして役所、とりあえず動くなら決して新しいソフトは入れない
    たぶん10年以上前の使ってるんじゃないの?
    大体こんなの検索避けしてどうするんだよっていうのばっかりじゃねーかw
    ほんと放射脳は始末に負えねぇ…

  10. watch@名無しさん より:

    OCRソフトなら普通の事だろ。
    知ったかぶりして恥ずかしいコメしてる奴が多すぎる

  11. watch@名無しさん より:

    公開されているPDFは電子データなのに、一体どこにOCR処理の入る余地があるんだか。
    わざわざ印刷してスキャンしてOCRしてんの?
    そうでなければ、画面キャプチャのOCRですか?馬鹿すぎる。
    1万歩譲ってバカOCRがこういう変換をしたとしても、業務プロセスを見直す必要がある。
    非効率な仕事やって税金取るなよ糞公務員が。

  12. watch@名無しさん より:

    ウチも紙媒体のテキストをデジタルに変換する作業を中国に依頼することがあるけど、5%位は誤字がある。
    「ー」と「一」とか、「タ」と「夕」とか。
    ぶっちゃけ、気づいても意味は伝わるからそのまま放置なんだけどね。

  13. メガエレクトロボルト より:

    余程目に触れたくないのだな
    >>34 嘘が隠されてるって事だよ

  14. watch@名無しさん より:

    ※10と※11の連携がいいね
    ※10がなんか可哀想になってきた(´;ω;`)ウッ…

  15. watch@名無しさん より:

    一昔前のコピペでコレに近いのなかった?
    ムカつく上司に嫌がらせするために、
    IMEに単語登録するやつ

  16. watch@名無しさん より:

    お前ら役所とかのOCR舐めてるだろ。
    質が低くて、マジでビックリするぜ。

  17. watch@名無しさん より:

    税金を使い切る原子力庁のマシンが10年も前のを使ってるわけないじゃん。

  18. watch@名無しさん より:

    カ道山って検索してもえらい出る
    検索避け陰謀論唱えてた奴は今頃顔真っ赤だろうな・・・

  19. watch@名無しさん より:

    ※11
    お前は何も行政の仕事を分かってない
    簡単に電子データくれると思うなよ
    平気で印刷物渡して来て、それを電子化しろと言う
    ※14もそうだが、知らない事はしゃべらない方がいい
    まともに働いてないからそんなコメントしかできないんだよ

  20. watch@名無しさん より:

    OCRなら普通の事。
    ちなみに辞書マッチングすれば大丈夫ってのも本当の事。
    この手のミスはほぼ修正される、が、OCRかけた後自動的に辞書マッチングして文章を補正してくれるソフトはたぶん無いぞ。手動で実行しないといけない。
    おそらく印刷物をOCRかけた後、辞書マッチングしなかったんだろ。
    その上で目視チェックとか言ってるから、作業者がコンピュータに詳しくないって事だろう。
    ※11
    OCRかけたのがPDFファイルだろ?そのPDFファイルのファイル名自体もOCR元からコピペしたんじゃないの?
    そのあたりの経緯は公開されてないから、陰謀論だと言い張るならそれでいいけど、OCRミスじゃないって証明にはなって無いよ。
    ついでに書くと、全員が全員目が良いわけじゃない。紙で資料を配るのは、まだまだ当たり前の事だ。

  21. watch@名無しさん より:

    OCRミスだろ派が多い理由は、
    放射脳が適当な事をここ3年言い続けて来た反動でもあるんだよな~。
    なぜか適当な事を言って足を引っ張る身内に矛先を向けない
    ブサヨと放射脳。
    そっくりだなぁと思う。

  22. watch@名無しさん より:

    「隠蔽するための陰謀」と「役所の仕事が非効率・古臭い」っていうのは全然次元の違う問題なのになんで一緒くたに論じるかなぁ
    陰謀だっていうなら故意にやっているという証拠出せよ

  23. watch@名無しさん より:

    ※6
    趣味じゃないんだ
    どれだけ自分の仕事と真摯に向き合っているか、を他人に測られてしまう
    こういう処で一事が万事「いいかげん」とレッテル貼られても文句言えない

スポンサーリンク




WP Twitter Auto Publish Powered By : XYZScripts.com
タイトルとURLをコピーしました