1: ノチラ ★ 2018/03/12(月) 16:59:56.93 _USER
771index
データ分析最強ツール「R」の実力
Rは、統計分析に特化したプログラミング言語です。プログラミング言語、というくくりではありますが、統計分析に特化したシンプルな作りになっています。

取っ付きやすさの大きな要因になっているのは、データフレーム、という考え方です。データフレームは列と行という表形式になっていて、Excelで扱うデータ形式と似ているため、Excelに慣れ親しんでいる人であれば、少し使ってみるだけでRに対する違和感はすぐに消えることでしょう。

しかもRは決してマイナーなツールではありません。研究者やデータサイエンティストの間では、分析のツールとして非常にポピュラーです。またRはオープンソースであり、世界中のユーザによって日夜開発が進められ、日々進化しています。

そういうとプロの分析者が使うツールだと思われがちですが、実際にはExcel以上に簡単に、かつExcelだけでは対処が難しい問題を解決できます。フリーのツールなので導入もスムーズです。

さきほどExcelに対してあげた三つの問題点である

・データ量が膨大になると動作が不安定
・一度やった分析を保存できない
・すぐに実行できる分析ツールが限られている

について、Rだとどのように対応しているのかみていきます。

(1)大規模データでも軽快に動く

Excelで扱うことができるデータ量ですが、Excel2013では最大行数は1,048,576行、最大列数は16,384列となっています。ただし、実際にはこれ以下の数十万件レベルで動作が不安定になります。

対してRで扱うことができるデータ数は、1000万行程度×400列であれば、PCのスペックにも依存しますが、たいていは動作も軽快です。Excelでは動作が不安定だったデータ量でも、Rならば動作は常に快適です。

(2)分析手順が残るので、やり直しも簡単

Excelの場合は分析手順は基本的に残らないので、自分で記録を取っておく必要があります。手順の実行は基本的に手動です。

対してRはプログラミング言語なので、当然処理の過程がコードとして全て残ります。どこか間違っていても、そこを修正してまたボタン一つで全ての処理をやってくれる。グラフを描く過程もコードにできます。

(3)最新の分析ツール(アルゴリズム)が使える

Excelはマイクロソフトの製品なので、バージョンアップもマイクロソフト次第です。

対してRはオープンソース。全世界から有志が開発に参加しているので、日々改修が行われています。学会で発表された最新のアルゴリズムも、すぐにパッケージがリリースされ、そのパッケージをインストールしさえすればすぐに使えるようになっています。
http://gendai.ismedia.jp/articles/-/54570
引用元: http://egg.5ch.net/test/read.cgi/bizplus/1520841596/


2: 名刺は切らしておりまして 2018/03/12(月) 17:01:46.66
時代はロータス123

3: 名刺は切らしておりまして 2018/03/12(月) 17:01:47.10
ExcelマクロでRに変換する案件が増えて良かったな

4: 名刺は切らしておりまして 2018/03/12(月) 17:05:03.93
その前にアクセスという考えはないのか?

66: 名刺は切らしておりまして 2018/03/12(月) 18:39:35.55
>>4
それな。
あんまりこの手のプロダクツとか
テクノロジーに詳しくない奴が書いてるのかな。

6: 名刺は切らしておりまして 2018/03/12(月) 17:07:12.78
名前がRて…固有名詞なら、もっと検索で識別しやすい名前にすればいいのに

29: 名刺は切らしておりまして 2018/03/12(月) 17:24:19.15
>>6
これ
命名した奴本当バカ

7: 名刺は切らしておりまして 2018/03/12(月) 17:09:05.90
一太郎だろ

10: 名刺は切らしておりまして 2018/03/12(月) 17:09:58.07
A3で印字しても見えないくらい縮小されてたら
見る気もしない

12: 名刺は切らしておりまして 2018/03/12(月) 17:10:31.46
他の言語とどう違うの?
Fortran, Pascal, C, C++, Perl, PHP, Java, Python その他シェルとかいろいろやった俺に
説明してみて

24: 名刺は切らしておりまして 2018/03/12(月) 17:20:12.74
>>12
統計処理特化言語
統計処理というのは基本的に複数の処理方法の結果が欲しい
例えば高校生レベルなら
最大、最小、平均、中央値 が欲しくなったりする
この言語だと summary 関数呼び出せばそれらがまとめて一気に手に入る
同様に t検定だと t.test で
p値のみならず信頼区間などよく使う関連性の高いものがまとめて出力される

このように、Rを使うのは統計処理をする関数の中身が
よく使う処理をまとめて行ってくれる手軽さが魅力的な言語だ

13: 名刺は切らしておりまして 2018/03/12(月) 17:11:04.92
究極超人

14: 名刺は切らしておりまして 2018/03/12(月) 17:12:04.07
あ〜る?

17: 名刺は切らしておりまして 2018/03/12(月) 17:14:43.55
Uあーるであーる

18: 名刺は切らしておりまして 2018/03/12(月) 17:15:09.82
数十万件レベルのデータをExcelの中に置いたりするのかね

22: 名刺は切らしておりまして 2018/03/12(月) 17:18:28.53
>>18
某生保ではやってます
PC処理能力が必要です(でかいとフリーズする)
いろんな観点で分析するので

25: 名刺は切らしておりまして 2018/03/12(月) 17:21:17.52
>>22

保険料の払い渋りでボロ儲けしてるんだから、SPSSぐらいサクッと経費で買えよw

27: 名刺は切らしておりまして 2018/03/12(月) 17:23:00.99
>>25
保険金な

20: 名刺は切らしておりまして 2018/03/12(月) 17:17:53.09
フリーソフトだっけ?
でも、理系学部の人たちが使うものでしょ。
ウィンドウズが跋扈する社内で、使っても、孤立するだけだし。

23: 名刺は切らしておりまして 2018/03/12(月) 17:19:42.51
マジレスをすると、まともに統計解析やりたいなら、SPSSとかの統計専門ソフトだろうね。

26: 名刺は切らしておりまして 2018/03/12(月) 17:22:21.08
ところで cygwin にR言語インストールできなくて困ってる
ビルドにも失敗する
Linuxだとパッケージで一発なのだが

37: 名刺は切らしておりまして 2018/03/12(月) 17:27:53.15
>>26
ファイル足りないか更新が必要なんじゃね

40: 名刺は切らしておりまして 2018/03/12(月) 17:28:40.33
>>26
Windows使うのやめればいいだけだな
俺はWindows使わなくていい会社に転職した

31: 名刺は切らしておりまして 2018/03/12(月) 17:26:10.22
ツールというならSPSSとかTensor Flowとかだと思ってた

33: 名刺は切らしておりまして 2018/03/12(月) 17:26:26.14
ExcelかRかっていう二択な時点で頭悪すぎる。
Excelでデータ入力してRで読んで解析が効率良いだろ。

41: 名刺は切らしておりまして 2018/03/12(月) 17:30:06.81
>>33
最初にエクセルシートのデータ入力して
使うのか?
VBAより簡単?

53: 名刺は切らしておりまして 2018/03/12(月) 17:53:41.15
>>41
やろうとしている内容にもよるだろうけど、総じてRの方が手軽だと思う。

35: 名刺は切らしておりまして 2018/03/12(月) 17:27:29.23
全然しらないけどデータの取り込みはどうやるの?

39: 名刺は切らしておりまして 2018/03/12(月) 17:28:03.32
方眼紙上手く書けるかな?

43: 名刺は切らしておりまして 2018/03/12(月) 17:33:28.42
S のフリー版みたいな話なんだっけ?

46: 名刺は切らしておりまして 2018/03/12(月) 17:39:34.14
ワードにエクセルはめ込みが最強

49: 名刺は切らしておりまして 2018/03/12(月) 17:46:47.10
パワポ好きの人がw

50: 名刺は切らしておりまして 2018/03/12(月) 17:50:14.00
ロータス、Microsoftオフィス97で十分。
フリーソフトだしな。w

52: 名刺は切らしておりまして 2018/03/12(月) 17:53:30.29
Rは便利だけど、先を考えると、Pythonの方がええで。

55: 名刺は切らしておりまして 2018/03/12(月) 17:55:25.59
今の最先端は、計算尺じゃよ。
ソロバンも会社に導入しよう。

58: 名刺は切らしておりまして 2018/03/12(月) 18:07:22.34
古い一太郎やエクセルでも変換できるソフトが有るから、
使いづらくなった最新ソフトをいたずらに追う必要はないだろう?
古い一太郎ファイルを貰う→変換ソフトで新しいワードで使う。
→変換ソフトで古い一太郎に変換する。w

http://www.systemport.co.jp/product/cs17/taio_wp.html

60: 名刺は切らしておりまして 2018/03/12(月) 18:11:51.44
どっちが上とか下とかいってもしょうがないだろうな
単純にデータを入力収集するならエクセル
簡単な統計解析もエクセルでできる
より本格的な(しかし典型的な)処理が必要ならRに持ってく
さらに独自の処理をしたいならパイソンとかで自分で制御

63: 名刺は切らしておりまして 2018/03/12(月) 18:24:41.66
マルウェアとか大丈夫か?

64: 名刺は切らしておりまして 2018/03/12(月) 18:24:45.57
ちょっと前までは、パワポ職人が大企業では重宝されていたようだな。
内容よりも見た目重視。(プレゼン重視)
生産性大幅に低下。

65: 名刺は切らしておりまして 2018/03/12(月) 18:26:53.32
「博士採用数と業績はご覧のとおり負の相関があります。
つまり博士を採用すると業績が悪化します。」
「でもさ、結局統計でしょ?本人の頑張り次第だから」

これがお前らの職場の会話だろ、Rとか全く不要

68: 名刺は切らしておりまして 2018/03/12(月) 18:43:51.21
なんでソフトと言語を比べるの?
馬鹿なの?死ぬの?

77: 名刺は切らしておりまして 2018/03/12(月) 18:59:05.05
>>68
バカでR

71: 名刺は切らしておりまして 2018/03/12(月) 18:50:27.61
GT-R

73: 名刺は切らしておりまして 2018/03/12(月) 18:53:49.66
30代だが大学はMatlab使ってたな。
それより便利なん?

74: 名刺は切らしておりまして 2018/03/12(月) 18:54:23.23
エクセルに分析ツール入れると統計処理にも結構使える
グラフ化など見栄え良くするにも便利
Rは言語が簡単なのでプログラミングの学習にも使えそう

76: 名刺は切らしておりまして 2018/03/12(月) 18:56:34.13
で、使いやすいフロントエンド教えろやお前ら

80: 名刺は切らしておりまして 2018/03/12(月) 19:01:55.08
accessできる人

82: 名刺は切らしておりまして 2018/03/12(月) 19:06:59.21
Excellは重過ぎるよ
Office2000の機能でいいから、Rとやらで同機能Versionを作ってくれ

スポンサード リンク