1: ノチラ ★ 2017/12/23(土) 20:36:54.90 _USER
img_ac2aed187b02d600ba5549240896eed91348640
中略
「ITと統計学の素晴らしき結婚」で生み出されたもの
では、高校までの数学教育はどのようにすればよいのでしょうか?

私の個人的な考え方は「統計学と機械学習の専門的な勉強がはじめられることをゴールとして、高校までの数学のカリキュラムは再編成されるべきである」というものです。

統計学に加えてここで突然機械学習の話が登場したことに驚いた方もいらっしゃるかもしれません。「統計学と機械学習」あるいは「統計学と人工知能」と言われると、多くの人がなんだか全く別のもののように感じるはずです。しかし、実はその背景にある数学的な道具立ては「全く一緒」と言っても過言ではありません。

初代『統計学が最強の学問である』では、この20年ほどで統計学がとんでもなくパワフルになった理由として「ITと統計学の素晴らしき結婚」という表現をしました。多くの人が大学の教養課程で習う「紙とペンの統計学」が、コンピューターサイエンスという強力な伴侶を得たことにより、現実的な問題の意思決定に際して大きな力を持つようになったわけです。しかし、この結婚によって生まれたのは「現代的な統計学」だけではありません。もう1つ「現代的な人工知能」というとてもパワフルな兄弟をも産み落としました。

1950年代にはじめて「人工知能」という言葉が使われるようになってからの第一次人工知能ブーム、そして1980年代の第二次ブームのそれぞれで、人工知能研究の主流は「コンピューターに人間の持つ論理や知識を教え込むことで知能を生み出せるのではないか?」という考え方でした。当時のこうした考え方に基づき書かれた人工知能研究の論文や書籍を見てみると、そのほとんどは記号論理学のような話ばかりが記述されており、統計学とは全く別の分野であると言えます。ただし、こうした「人間がコンピューターに論理と知識を教え込む」というやり方は行き詰まりを見せ、これら二度の人工知能ブームは廃ってどちらも冬の時代を迎えました。

一方で少なくとも1960年代の終わり頃からちらほらと、一部の人工知能の研究者たちは「確率」や「データへのあてはまり」といった統計学の概念を取り入れはじめます。たとえばディープラーニングは専門的には「層の数がとても多い(ディープな)ニューラルネットワーク」であると表現されますが、実は世界に先がけて多層ニューラルネットワークによる画像認識を研究した日本の甘利俊一は、ニューラルネットワークに統計学のような確率や微分といった考え方を持ち込みました。こうした「データとデータの間の最もあてはまりのよい数学的な関係性を推定する」という統計学的な考え方は、現代のディープラーニングの中でも大きく役に立っています。

話をまとめると、「ITと統計学の素晴らしき結婚」によって次の2つがこの世に生み出されたということです。

1つは統計学において、紙とペンの手計算だけでは難しい分析がコンピューターによる計算アルゴリズムで実現できるようになりました。これが「現代的なITによる統計学」です。一方で、コンピューターサイエンスの世界で生まれた人工知能研究においても、記号論理学のような理屈や知識表現だけではうまくいかなかったことが、統計学の理論と計算方法によって実現できるようになりました。このようなクロスオーバーが、現代のデータ社会の中でとても大きな力を発揮しているのです。そしてそれゆえに、統計解析手法と機械学習手法を数学的に記述するやり方は、細かい慣例などの違いこそあれ「基本的に全く同じ」というわけです。違いがあるとすれば数学的な理屈の後の、「どういうアルゴリズムでコンピューターを働かせるか」という部分ぐらいでしょうか。

そうすると、いまエンジニアたちが統計学と機械学習の背後にある数学に慣れておくことは、前述のような品質の向上や、生産計画の最適化に使うという以上の意味を持ちます。蒸気やガソリンを使ったエンジンを使いこなすために熱力学を理解するとか、電子部品を使いこなすために電磁気学を理解する、といったのと同じようなレベルで、これからのものづくりにおいてその競争力の少なからぬ割合が、機械学習技術をどう活かすか、というところと関係してくるからです。
http://diamond.jp/articles/-/153736
引用元: http://egg.5ch.net/test/read.cgi/bizplus/1514029014/


32: 名刺は切らしておりまして 2017/12/23(土) 22:12:42.00
線形代数 → 確率統計学 → 機械学習
の理論的展開が分かっていない人のための>>1だと分からないか?

33: 名刺は切らしておりまして 2017/12/23(土) 22:14:35.60
>>32
まあ、確率を使わないというのも俺を認知症にしようって罠だしね

49: 名刺は切らしておりまして 2017/12/23(土) 22:37:50.80
>>32
その分野をまとめて同じというなら、線形代数とその応用分野は同じということになるから、ORも代数解析も、数理計画法も確率論も全部同じ数学という話になる。

2: 名刺は切らしておりまして 2017/12/23(土) 20:38:40.92
どれもこれも、俺が使ってる名古屋大学設計の伊藤製作所の椅子を真似した嘘です

4: 名刺は切らしておりまして 2017/12/23(土) 21:04:51.48
まったくいっしょじゃないよ
数学は公理体系がちがえばまったくちがうものになる
そんなのもしらんのか

70: 名刺は切らしておりまして 2017/12/24(日) 01:21:51.11
>>4
何も分かってないやつが利いた風な口を利くと、本当に痛いなw

5: 名刺は切らしておりまして 2017/12/23(土) 21:06:54.22
イギリスは、使ってる椅子をどれもこれもウイルスだと言っていた

それが、トヨタ自動車の名古屋がからんだ途端に舌の枚数を増やした

7: 名刺は切らしておりまして 2017/12/23(土) 21:34:51.00
やれやれ、両方とも線形代数の上に作られた学問なんだが、
統計学には2つあって、
1) 1万人のデータがあればそれを絶対視して、1万1人目のデータを○×で判断する
 検定主義
2) 1万人のデータがあれば、1万1人目のデータはその一つでしかないと考えるベイズ
 統計学
がある。1)なら1万100人目でも、すーっと同じ判断をするから学習しない。2)なら
1万100人目は学習して違う判断をするはず。そこまで言えば機械学習がどちらの理屈で
動いているか分かるだろ。

8: 名刺は切らしておりまして 2017/12/23(土) 21:36:54.08
iMacのCPUのHaswellの洒落でも、アメリカ人はこれを幽霊船と言ってますが

10: 名刺は切らしておりまして 2017/12/23(土) 21:44:38.48
1万人のデータから得られた平均μ、標準偏差σがあったとして、
30人の実験をしてみて得られたデータXがあるとする。
検定主義なら平均μ、標準偏差σを絶対として、実験が正しいか
誤りかを判断するしかない。
ベイズ統計学ならこの実験結果を基に平均と標準偏差がどう分布
しているか、をμ(X), σ(X)を考える。Xが増えるごとにこの推定値が
変化していく=学習なわけだね。

11: 名刺は切らしておりまして 2017/12/23(土) 21:50:12.16
構文解析とか機械学習とか言うけど、古いパーシングミサイルの再開発でしょ
危ないわ

12: 名刺は切らしておりまして 2017/12/23(土) 21:51:47.06
多変量解析やし

13: 名刺は切らしておりまして 2017/12/23(土) 21:54:33.91
もっと具体的に行こう。
表裏同一の確率で出る本物のコインと表60%裏40%のニセのコインがそれぞれ
入っている2つの袋A, Bがあるとする。2つの袋にどちらが入っているかはまったく分からない。
ニセである確率は1/2ずつである。

Aの袋から1枚コインを取り出しトスしてみたら表が出た。表が出たことでAがニセコインの
袋である確率は上がったか上がらないか、そういうことだ。

17: 名刺は切らしておりまして 2017/12/23(土) 22:05:18.88
>>13
悪いけど、今の統計学では確率の話はしないんだ。

19: 名刺は切らしておりまして 2017/12/23(土) 22:07:15.21
>>17
フジテレビの柳沢慎吾にやった詐偽を再現するかどうか言ってるだけ

14: 名刺は切らしておりまして 2017/12/23(土) 21:57:13.80
結局ただの多変量解析だし。
ソフトがあれば十分。
weka使え。

15: 名刺は切らしておりまして 2017/12/23(土) 22:01:33.88
Weでいま大問題なんですが、嘘ぶいたのがまずかった

16: 名刺は切らしておりまして 2017/12/23(土) 22:04:18.40
最小二乗法を教えとけば良いんじゃないの?

あとは文系も含めて行列を必修にするとか。

21: 名刺は切らしておりまして 2017/12/23(土) 22:07:45.37
>>16
まあ、最近は機械学習でまOLE使うようになったけど、まだ勾配降下法の方が多いだろう。

機械学習って基本は問題解決の話であって、統計分析の話じゃないから。

20: 名刺は切らしておりまして 2017/12/23(土) 22:07:27.60
きのこの山とたけのこの里がそれぞれ入っている袋がある。
外側から見ても、それぞれの確率は1/2である。

画像をカメラで取り込める機械学習できるコンピュータが
あったとして、100回どちらか判断させたら60%正解
40%不正解であった。101回目の結果をコンピュータに
教えたら、その正解の確率が上がる=ベイズ統計学的な
学習であるわけだね。

24: 名刺は切らしておりまして 2017/12/23(土) 22:08:51.71
>>20
そういう学習をしているニューラルネットはないわけではないが、主流ではない。

29: 名刺は切らしておりまして 2017/12/23(土) 22:10:08.24
>>24
原理の説明だ。じゃあどうやっているか説明してもらおう。

47: 名刺は切らしておりまして 2017/12/23(土) 22:35:58.05
>>29
ググレカス。

検索エンジンの要約だってもう少しまともだ。

23: 名刺は切らしておりまして 2017/12/23(土) 22:08:37.44
純粋数学は別として応用数学では統計学が重要だよな。
とくに最近のビッグデータ処理技術と結びつくと無敵だわ。
世の中、正確な答えよりも、最適な答えの方が価値があるからね。
グーグルがのしてきたのも、ビッグデータと統計学(機械学習)のおかげ。

27: 名刺は切らしておりまして 2017/12/23(土) 22:09:30.52
>>23
言ってることは間違ってないが、お前がその話を理解できてないのはわかっている。

25: 名刺は切らしておりまして 2017/12/23(土) 22:09:10.64
今は開発競争が盛んだけど、数年もしたら汎用的なツールに収斂するんじゃないかな
そうなればアルゴリズムよりETLの方が人手が要るだろうけど
そこに必要なのは数学ではないんだよなあ

34: 名刺は切らしておりまして 2017/12/23(土) 22:16:32.79
多変量解析と機械学習の根本的な差が分からない奴は、結局分かって
いない人だな。

37: 名刺は切らしておりまして 2017/12/23(土) 22:21:12.87
>>34
PhD持ちだけど両者に実質的な差なんてない。
無論差があるんですかって聞かれたらあるって答えるけどな。
その方が儲かるから。

35: 名刺は切らしておりまして 2017/12/23(土) 22:16:37.37
機械学習をAIと呼ぶ今の風潮なんなん?

超簡単に言っちゃうと回帰分析の高級版だろ?

36: 名刺は切らしておりまして 2017/12/23(土) 22:18:42.58
>>35
スティーブ・ジョブズが死んだのは嘘で
みんなのデータもIDもスロットマシーンにしか見て無くて
嫌味でラスベガスに隠れてるってだけかもな

39: 名刺は切らしておりまして 2017/12/23(土) 22:22:35.40
説明する

根拠もなく否定する

説明する

長文を連投する

そういう発達障害のお友達が集うのがネットの世界だな。

43: 名刺は切らしておりまして 2017/12/23(土) 22:27:14.57
>>39
最後の一文

>根拠もなく否定する

42: 名刺は切らしておりまして 2017/12/23(土) 22:26:30.68
自分が高校生の頃は統計学なんてなかったと思うが、
今は高校で統計学を勉強するのか。
いいなぁ。

44: 名刺は切らしておりまして 2017/12/23(土) 22:28:33.84
>>42
>統計学と機械学習の専門的な勉強がはじめられることをゴールとして、
>高校までの数学のカリキュラムは再編成されるべきである

つまり現状はそうでないということ

45: 名刺は切らしておりまして 2017/12/23(土) 22:30:27.87
結局は線形代数、微積、確率、集合論が基礎になる。
これさえやっておけばだいたいの論文は読めるようになる。

50: 名刺は切らしておりまして 2017/12/23(土) 22:40:00.29
マンデルブロ集合の可視化はちょっとした革命

58: 名刺は切らしておりまして 2017/12/24(日) 00:17:21.03
さも凄いことを言うのかと思ったら、機械学習に統計処理をするっていう当たり前のこと言ってるだけじゃないか。
大学の授業とかでは昔から統計的機械学習と呼んできて、世間ではそれを省略して単に機械学習って呼んでるだけだし。

いわゆる統計学と機械学習では使う数学に乖離もあるし、何のことかと思った。
この著者の西内啓って人、統計屋さんらしいから、最近の人工知能ブームに乗って、統計やってる俺すげーって言いたいだけかな。

60: 名刺は切らしておりまして 2017/12/24(日) 00:24:40.70
>>58
まぁ、結局”最適解”を求める手段のひとつにすぎないからね

61: 名刺は切らしておりまして 2017/12/24(日) 00:31:07.94
測度論と関数解析と確率解析やっておけば
統計がどうだとかアホなこと言わんで済むのに
だから統計屋は嫌い

62: 名刺は切らしておりまして 2017/12/24(日) 00:31:13.27
オリックスの宮内さんだと思うけど、ノートパソコンとかラップトップのほうが
頭良くなるって聴か無いからな

どうも官僚も同じ意見らしい、理由は不明

66: 名刺は切らしておりまして 2017/12/24(日) 00:47:46.95
経済学で使う数学は全く別物だけどなw

69: 名刺は切らしておりまして 2017/12/24(日) 01:05:58.95
統計バカになる事が頭が良くて、預言者みたいな
存在だと思ってるらしい

71: 名刺は切らしておりまして 2017/12/24(日) 01:23:19.39
すべてデータに基づき判断を引き出すと云う点では
同じものだよね。

生身の人間の脳では、価値観とか妄想とか意図的なウソ情報とかで
別な判断を出してしまう。  だから、将棋のたぐいのような明確なルールに
のみ依存して動く世界以外では、AIの出す判断は必ずしも有効でない場合が
多いと思うわ。 政治の動きや芸術の評価や男女関係などな。

72: 名刺は切らしておりまして 2017/12/24(日) 01:43:47.17
データ処理に紙とペンの手計算なんて何十年前の話をしてんだ。
コンピュータがパンチカードの頃でさえ、FORTRANで書いて統計処理してたのに。
というか、PCが普及した20年以上前から誰も手計算なんかしてねえ。

76: 名刺は切らしておりまして 2017/12/24(日) 05:34:16.72
○○が最強
と言う大人は小児レベルの知能の持ち主で適材適所を知らない阿呆

79: 名刺は切らしておりまして 2017/12/24(日) 09:20:02.90
統計学は上品
機械学習は粗野

80: 名刺は切らしておりまして 2017/12/24(日) 09:24:23.58
統計学は理論的、演繹的、過程重視
機械学習はアルゴリズム的、帰納的、目的重視

スポンサード リンク