戻る

このページは以下URLのキャッシュです
http://www.watch2chan.com/archives/39292874.html


「東京電力」→「東京電カ」、「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」? 原子力規制庁、サイトを修正 : watch@2ちゃんねる

    「東京電力」→「東京電カ」、「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」? 原子力規制庁、サイトを修正

    コメント( 9 ) このエントリーをはてなブックマークに追加
            

    1:20世 ★@\(^o^)/ 2014/06/10(火) 14:19:52.31 ID:???0.net
    「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」 原子力規制庁、サイトを修正

    原子力規制庁がWebサイトで公開している資料の1つで、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼく)と 「口」(くち)になっていると指摘され、同庁が修正する騒ぎがあった。

     原子力規制委員会がWebサイトで公開している資料の中で、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼ く)と「口」(くち)になっていたとネットユーザーに指摘され、サイトを公開している原子力規制庁が修正する騒ぎ があった。画像PDFをテキスト化する際、文字認識(OCR)ソフトが間違った文字を認識してしまったことが原因 という。

    誤字があったページ。10日までに修正されている
    img1


     誤字があったのは、今年1月に開かれた「第10回特定原子力施設監視・評価検討会汚染水対策検討ワーキ
    ンググループ」の会議資料一覧ページ。「福島第一原子力発電所におけるストロンチウム分析の状況について
    [東京電力]」という資料の「ト」と「ロ」がそれぞれ漢字になっており、「検索避けのためにあえて漢字にしたので
    は」などと一部ネットユーザーの間で騒ぎになっていた。

     同庁によると、Webサイトに掲載するテキストは通常、手打ちで確認しているが、この会議は資料が届いたタイ ミングがギリギリだったため、画像PDFをスキャンし、OCRソフトにかけてテキスト化したものをそのまま貼り付け たという。掲載時に目視で確認したが、「ト」と「ロ」が違うことに気づかずにアップしてしまったという。

     ネットユーザーからの指摘を受け、6月9日に文字を修正。あわせて、同庁サイトのHTMLにほかに同様な 間違い(「キ」と「千」のミス、「力」(ちから)と「カ」(カタカナのカ)のミスなど)がないかチェックしたところ、見つから なかったという。同庁の広報担当者は「こちらのミスで申し訳ない」と話している。

     このほか、「東京電力」や「原子力」の「力」をカタカナの「カ」に変えてGoogle検索すると、関連のPDF資料 が出てくることも話題になった。これらも画像PDFをOCRソフトにかけた際の変換ミスが原因とみられる。

    http://www.itmedia.co.jp/news/articles/1406/10/news067.html



    3:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:21:49.07 ID:aVMY+zrV0.net

    姑息すぎるw


    50:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:33:53.93 ID:81+purdn0.net

    >>3
    「姑息」の誤用


    67:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:38:40.63 ID:5RlBgEBSO.net

    >>50
    誤用でもない
    相当追い詰められてるんだろ



    4:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:22:11.53 ID:Iy9xk8uW0.net

    放射脳はこれすら陰謀だと騒いでたからな
    完全にキチガイ化してる



    5:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:22:24.34 ID:NOm6+OiQ0.net

    そんなクソみたいなOCRソフトねーよ



    6:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:23:15.04 ID:doBIst210.net

    実は意図的にやりました
    スボククチチウム、東京電カ、原子カ



    7:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:23:28.18 ID:iArBq7d20.net

    また嘘吐いたのか
    これで何回目だよw


    60:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:36:19.86 ID:P60aBuIu0.net

    >>7
    むしろ本当の事を何も言ってないでしょw



    8:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:23:31.15 ID:qOdGY6Oy0.net

    テキスト化したものをそのまま貼り付けるだけの簡単なお仕事です。



    10:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:23:48.64 ID:ouxqFkXHO.net

    どこのソフト使ったんだよ



    11:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:23:50.42 ID:po2ufAPj0.net

    普通に検索にかからなくしただけだろ



    12:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:24:17.82 ID:gRX2A9/O0.net

    闇売春サイトかよw



    13:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:24:18.05 ID:NVkMmaKX0.net

    因縁かよ、放射脳はキチガイすぎ


    18:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:11.38 ID:po2ufAPj0.net

    >>13
    え?いや普通に検索避けだろ
    よくあるこういう企業のたしなみだろ
    不思議がるほどでもない


    34:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:28:25.13 ID:Iy9xk8uW0.net

    >>18
    「ス卜口ンチウム」になっていた文書はストロンチウムの量を過大評価しすぎてましたって内容だったんだけど
    これを検索避けにする意味って何?



    14:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:24:21.27 ID:0znvqCWG0.net

    どんなOCRだよ
    10年前のだって辞書搭載してるし、そんなミスせんだろ


    40:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:31:05.33 ID:Yx6+nbPt0.net

    >>14
    ろくでもないフリーソフト使ってるとか?
    行政で使うPC機材にGOMプレイヤー入れる事例がある位だからさ、
    そういう事がないとは言い切れないのが怖いんだわ


    57:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:35:38.72 ID:Vm+T0YYE0.net

    >>40
    パナのレッツノートの法人向けモデルなんて、OSリカバリデータに初期アプリとしてGOMプレーヤー入ってたなあw


    41:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:31:14.14 ID:NNI8bS370.net

    >>14
    eTypistなんかだと認識間違える時こんな感じだよ。
    2chかよ!って突っ込み入れたくなる時も多々ある。



    16:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:01.31 ID:2+mXjsiI0.net

    OCRは意味不明な単語になる間違いはしない。



    17:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:07.36 ID:Yx6+nbPt0.net

    アウトソーシングで海外に文章起こしでもやらせた結果かと思ったがOCRかよ
    どこのOCRソフト使ってるのよ



    19:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:11.66 ID:NOm6+OiQ0.net

    PDFって文字ひろえるよな?



    21:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:25.64 ID:rN4WfZEw0.net

    となりの卜卜口



    24:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:25:52.00 ID:CSV4sZ450.net

    曰本人として恥ずかしい



    30:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:27:08.26 ID:X4UqvONW0.net

    トウキョウデンカ?



    32:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:28:06.31 ID:NOm6+OiQ0.net

    PDFの文書自体は間違ってないのなら
    そこから文字コピペするほうが早いだろ。
    こんな少ない文字数をわざわざOCRとか普通しないし



    35:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:29:20.62 ID:CGFymSc+0.net

    担当者ねらーだろw



    36:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:29:44.75 ID:/TuqFY6K0.net

    こういうことするから疑念を持たれるんだよバカ。



    37:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:30:37.77 ID:0B+IXukp0.net

    そんなクソ仕様のOCRあるわけねーだろw



    39:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:31:03.06 ID:Nw/AbxZs0.net

    生産性の低い仕事してんな~
    役人なんてこの程度のバカばっかりなんだね



    46:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:33:12.28 ID:RJKtdfzU0.net

    原子カ(か)ムラ PDFで検索すると首都圏反原発連合とか出てくるんだけど
    この人達は何で隠蔽したがってるの?w



    52:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:34:24.89 ID:RgaPlwMc0.net

    予想通り過ぎの対応
    やっぱり検索避けじゃねぇーか



    54:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:35:29.93 ID:AqkzKxS7O.net

    しかしよくまあ次から次にこういう嘘を考えつくもんだ。



    55:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:35:35.61 ID:NtiV4rri0.net

    スレタイを10回くらい読み直しちまったじゃねえか



    56:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:35:36.69 ID:gRX2A9/O0.net

    官僚の天下り先の特殊法人が作ったソフトだな たぶんw



    59:名無しさん@0新周年@\(^o^)/ 2014/06/10(火) 14:35:59.08 ID:gng/CaLl0.net

    「FFを中国人に作らせたらチョコボがチョコポになってたwww」を思い出した。




    このエントリーをはてなブックマークに追加

    コメント( 9 ) ネット

    最新!おすすめ人気記事



    週間人気記事







      コメント

        • 1: watch@名無しさん
        • 2014年06月10日 20:33
        • ID:xtqybLuw0
        • 中国や韓国に外注するとよくこういうミスはある。
          まさか・・・・いやいや。わざとだな。


        • 2: まとめブログリーダー
        • 2014年06月10日 20:59
        • ID:o6.w71g20
        • 大阪民国とか修羅の国とかネタにされるけれど、東大とか東電とか『東京』のつく物はガチでヤバいからネタにすら出来ないんだよな…


        • 3: watch@名無しさん
        • 2014年06月10日 21:01
        • ID:OAVrj3oH0
        • 日本は今日も平和だなぁ~ (-.-)


        • 4: watch@名無しさん
        • 2014年06月10日 21:22
        • ID:PzlM2H0N0
        • こういうリトマス紙的なニュースを出して、国民の反応を見てから、深夜とかにこそっと重大な情報を出してきたりしてるからな


        • 5: watch@名無しさん
        • 2014年06月10日 21:26
        • ID:iEXrKbOk0
        • 普通のOCRソフトだと、かなの間の漢字だから原子と来たら「力(りょく)」を辞書から優先的に持ってくる。まして原子力規制委員会で使用しているなら予め頻繁に使用する単語や専門用語は辞書とうろくさせている筈だ。

          この手のソフト開発に関わった方ならわかると思う、こんな誤変換は絶対有り得ないと。


        • 6: watch@名無しさん
        • 2014年06月10日 22:02
        • ID:00HvWfje0
        • わざとだとかよく有るとか色々書かれてるけど、これって何か重要な事なの?


        • 7: watch@名無しさん
        • 2014年06月10日 22:23
        • ID:gnv6MorG0
        • この情報公開しても何も反響はないので問題の無い文章と決定事項である言いたいんじゃないの?

          でもばれちゃったね


        • 8: watch@名無しさん
        • 2014年06月10日 22:27
        • ID:h27wpQ560
        • あのコピペがないってだけで糞スレ


        • 9: watch@名無しさん
        • 2014年06月10日 23:18
        • ID:AbC90OOs0
        • OCRなら普通にこの手のミスはある
          まして役所、とりあえず動くなら決して新しいソフトは入れない
          たぶん10年以上前の使ってるんじゃないの?

          大体こんなの検索避けしてどうするんだよっていうのばっかりじゃねーかw
          ほんと放射脳は始末に負えねぇ…


      コメントする

      名前
       
        絵文字
       
       
      【注意事項】
      以下の表現が含まれる書き込みを禁止致します。
      もし含まれているのを確認した場合、管理人がコメントの修正・削除をさせていただきます。
      ・アダルト、卑猥
      ・暴力的
      ・人種差別
      ・誹謗中傷

      記事検索
      スポンサードリンク
      このサイトについて
      管理人がネットで見つけた気になるネタ・ニュースを紹介しているブログです。古いニュースやつまらないネタを取り上げる場合もありますが、生暖かい目で見てやってください^^




      ツイッターで最新情報を配信しています。
      フォローお願いします
      ブログパーツ
      最新記事(画像付)
      楽天おすすめ
      スポンサードリンク
      カテゴリー
      アーカイブ
      アクセスカウンター
      • 今日:
      • 昨日:
      • 累計:

      QRコード
      QRコード
      スポンサードリンク