1:20世 ★@\(^o^)/ 2014/06/10(火) 14:19:52.31 ID:???0.net
「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」 原子力規制庁、サイトを修正
原子力規制庁がWebサイトで公開している資料の1つで、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼく)と 「口」(くち)になっていると指摘され、同庁が修正する騒ぎがあった。
原子力規制委員会がWebサイトで公開している資料の中で、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼ く)と「口」(くち)になっていたとネットユーザーに指摘され、サイトを公開している原子力規制庁が修正する騒ぎ があった。画像PDFをテキスト化する際、文字認識(OCR)ソフトが間違った文字を認識してしまったことが原因 という。
誤字があったページ。10日までに修正されている
誤字があったのは、今年1月に開かれた「第10回特定原子力施設監視・評価検討会汚染水対策検討ワーキ
ンググループ」の会議資料一覧ページ。「福島第一原子力発電所におけるストロンチウム分析の状況について
[東京電力]」という資料の「ト」と「ロ」がそれぞれ漢字になっており、「検索避けのためにあえて漢字にしたので
は」などと一部ネットユーザーの間で騒ぎになっていた。
同庁によると、Webサイトに掲載するテキストは通常、手打ちで確認しているが、この会議は資料が届いたタイ ミングがギリギリだったため、画像PDFをスキャンし、OCRソフトにかけてテキスト化したものをそのまま貼り付け たという。掲載時に目視で確認したが、「ト」と「ロ」が違うことに気づかずにアップしてしまったという。
ネットユーザーからの指摘を受け、6月9日に文字を修正。あわせて、同庁サイトのHTMLにほかに同様な 間違い(「キ」と「千」のミス、「力」(ちから)と「カ」(カタカナのカ)のミスなど)がないかチェックしたところ、見つから なかったという。同庁の広報担当者は「こちらのミスで申し訳ない」と話している。
このほか、「東京電力」や「原子力」の「力」をカタカナの「カ」に変えてGoogle検索すると、関連のPDF資料 が出てくることも話題になった。これらも画像PDFをOCRソフトにかけた際の変換ミスが原因とみられる。
http://www.itmedia.co.jp/news/articles/1406/10/news067.html
原子力規制庁がWebサイトで公開している資料の1つで、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼく)と 「口」(くち)になっていると指摘され、同庁が修正する騒ぎがあった。
原子力規制委員会がWebサイトで公開している資料の中で、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼ く)と「口」(くち)になっていたとネットユーザーに指摘され、サイトを公開している原子力規制庁が修正する騒ぎ があった。画像PDFをテキスト化する際、文字認識(OCR)ソフトが間違った文字を認識してしまったことが原因 という。
誤字があったページ。10日までに修正されている
誤字があったのは、今年1月に開かれた「第10回特定原子力施設監視・評価検討会汚染水対策検討ワーキ
ンググループ」の会議資料一覧ページ。「福島第一原子力発電所におけるストロンチウム分析の状況について
[東京電力]」という資料の「ト」と「ロ」がそれぞれ漢字になっており、「検索避けのためにあえて漢字にしたので
は」などと一部ネットユーザーの間で騒ぎになっていた。
同庁によると、Webサイトに掲載するテキストは通常、手打ちで確認しているが、この会議は資料が届いたタイ ミングがギリギリだったため、画像PDFをスキャンし、OCRソフトにかけてテキスト化したものをそのまま貼り付け たという。掲載時に目視で確認したが、「ト」と「ロ」が違うことに気づかずにアップしてしまったという。
ネットユーザーからの指摘を受け、6月9日に文字を修正。あわせて、同庁サイトのHTMLにほかに同様な 間違い(「キ」と「千」のミス、「力」(ちから)と「カ」(カタカナのカ)のミスなど)がないかチェックしたところ、見つから なかったという。同庁の広報担当者は「こちらのミスで申し訳ない」と話している。
このほか、「東京電力」や「原子力」の「力」をカタカナの「カ」に変えてGoogle検索すると、関連のPDF資料 が出てくることも話題になった。これらも画像PDFをOCRソフトにかけた際の変換ミスが原因とみられる。
http://www.itmedia.co.jp/news/articles/1406/10/news067.html
3:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:21:49.07 ID:aVMY+zrV0.net
姑息すぎるw
50:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:33:53.93 ID:81+purdn0.net
>>3
「姑息」の誤用
>>3
「姑息」の誤用
67:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:38:40.63 ID:5RlBgEBSO.net
>>50
誤用でもない
相当追い詰められてるんだろ
>>50
誤用でもない
相当追い詰められてるんだろ
4:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:22:11.53 ID:Iy9xk8uW0.net
放射脳はこれすら陰謀だと騒いでたからな
完全にキチガイ化してる
5:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:22:24.34 ID:NOm6+OiQ0.net
そんなクソみたいなOCRソフトねーよ
6:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:23:15.04 ID:doBIst210.net
実は意図的にやりました
スボククチチウム、東京電カ、原子カ
7:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:23:28.18 ID:iArBq7d20.net
また嘘吐いたのか
これで何回目だよw
60:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:36:19.86 ID:P60aBuIu0.net
>>7
むしろ本当の事を何も言ってないでしょw
>>7
むしろ本当の事を何も言ってないでしょw
8:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:23:31.15 ID:qOdGY6Oy0.net
テキスト化したものをそのまま貼り付けるだけの簡単なお仕事です。
10:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:23:48.64 ID:ouxqFkXHO.net
どこのソフト使ったんだよ
11:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:23:50.42 ID:po2ufAPj0.net
普通に検索にかからなくしただけだろ
12:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:24:17.82 ID:gRX2A9/O0.net
闇売春サイトかよw
13:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:24:18.05 ID:NVkMmaKX0.net
因縁かよ、放射脳はキチガイすぎ
18:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:11.38 ID:po2ufAPj0.net
>>13
え?いや普通に検索避けだろ
よくあるこういう企業のたしなみだろ
不思議がるほどでもない
>>13
え?いや普通に検索避けだろ
よくあるこういう企業のたしなみだろ
不思議がるほどでもない
34:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:28:25.13 ID:Iy9xk8uW0.net
>>18
「ス卜口ンチウム」になっていた文書はストロンチウムの量を過大評価しすぎてましたって内容だったんだけど
これを検索避けにする意味って何?
>>18
「ス卜口ンチウム」になっていた文書はストロンチウムの量を過大評価しすぎてましたって内容だったんだけど
これを検索避けにする意味って何?
14:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:24:21.27 ID:0znvqCWG0.net
どんなOCRだよ
10年前のだって辞書搭載してるし、そんなミスせんだろ
40:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:31:05.33 ID:Yx6+nbPt0.net
>>14
ろくでもないフリーソフト使ってるとか?
行政で使うPC機材にGOMプレイヤー入れる事例がある位だからさ、
そういう事がないとは言い切れないのが怖いんだわ
>>14
ろくでもないフリーソフト使ってるとか?
行政で使うPC機材にGOMプレイヤー入れる事例がある位だからさ、
そういう事がないとは言い切れないのが怖いんだわ
57:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:35:38.72 ID:Vm+T0YYE0.net
>>40
パナのレッツノートの法人向けモデルなんて、OSリカバリデータに初期アプリとしてGOMプレーヤー入ってたなあw
>>40
パナのレッツノートの法人向けモデルなんて、OSリカバリデータに初期アプリとしてGOMプレーヤー入ってたなあw
41:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:31:14.14 ID:NNI8bS370.net
>>14
eTypistなんかだと認識間違える時こんな感じだよ。
2chかよ!って突っ込み入れたくなる時も多々ある。
>>14
eTypistなんかだと認識間違える時こんな感じだよ。
2chかよ!って突っ込み入れたくなる時も多々ある。
16:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:01.31 ID:2+mXjsiI0.net
OCRは意味不明な単語になる間違いはしない。
17:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:07.36 ID:Yx6+nbPt0.net
アウトソーシングで海外に文章起こしでもやらせた結果かと思ったがOCRかよ
どこのOCRソフト使ってるのよ
19:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:11.66 ID:NOm6+OiQ0.net
PDFって文字ひろえるよな?
21:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:25.64 ID:rN4WfZEw0.net
となりの卜卜口
24:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:52.00 ID:CSV4sZ450.net
曰本人として恥ずかしい
30:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:27:08.26 ID:X4UqvONW0.net
トウキョウデンカ?
32:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:28:06.31 ID:NOm6+OiQ0.net
PDFの文書自体は間違ってないのなら
そこから文字コピペするほうが早いだろ。
こんな少ない文字数をわざわざOCRとか普通しないし
35:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:29:20.62 ID:CGFymSc+0.net
担当者ねらーだろw
36:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:29:44.75 ID:/TuqFY6K0.net
こういうことするから疑念を持たれるんだよバカ。
37:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:30:37.77 ID:0B+IXukp0.net
そんなクソ仕様のOCRあるわけねーだろw
39:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:31:03.06 ID:Nw/AbxZs0.net
生産性の低い仕事してんな~
役人なんてこの程度のバカばっかりなんだね
46:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:33:12.28 ID:RJKtdfzU0.net
原子カ(か)ムラ PDFで検索すると首都圏反原発連合とか出てくるんだけど
この人達は何で隠蔽したがってるの?w
52:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:34:24.89 ID:RgaPlwMc0.net
予想通り過ぎの対応
やっぱり検索避けじゃねぇーか
54:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:35:29.93 ID:AqkzKxS7O.net
しかしよくまあ次から次にこういう嘘を考えつくもんだ。
55:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:35:35.61 ID:NtiV4rri0.net
スレタイを10回くらい読み直しちまったじゃねえか
56:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:35:36.69 ID:gRX2A9/O0.net
官僚の天下り先の特殊法人が作ったソフトだな たぶんw
59:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:35:59.08 ID:gng/CaLl0.net
「FFを中国人に作らせたらチョコボがチョコポになってたwww」を思い出した。
まさか・・・・いやいや。わざとだな。