1: 名無しさん@趣味人 2018/03/12(月) 16:59:56.93 ID:CAP_USER
データ分析最強ツール「R」の実力
Rは、統計分析に特化したプログラミング言語です。プログラミング言語、というくくりではありますが、統計分析に特化したシンプルな作りになっています。
取っ付きやすさの大きな要因になっているのは、データフレーム、という考え方です。データフレームは列と行という表形式になっていて、Excelで扱うデータ形式と似ているため、Excelに慣れ親しんでいる人であれば、少し使ってみるだけでRに対する違和感はすぐに消えることでしょう。
しかもRは決してマイナーなツールではありません。研究者やデータサイエンティストの間では、分析のツールとして非常にポピュラーです。またRはオープンソースであり、世界中のユーザによって日夜開発が進められ、日々進化しています。
そういうとプロの分析者が使うツールだと思われがちですが、実際にはExcel以上に簡単に、かつExcelだけでは対処が難しい問題を解決できます。フリーのツールなので導入もスムーズです。
さきほどExcelに対してあげた三つの問題点である
・データ量が膨大になると動作が不安定
・一度やった分析を保存できない
・すぐに実行できる分析ツールが限られている
について、Rだとどのように対応しているのかみていきます。
(1)大規模データでも軽快に動く
Excelで扱うことができるデータ量ですが、Excel2013では最大行数は1,048,576行、最大列数は16,384列となっています。ただし、実際にはこれ以下の数十万件レベルで動作が不安定になります。
対してRで扱うことができるデータ数は、1000万行程度×400列であれば、PCのスペックにも依存しますが、たいていは動作も軽快です。Excelでは動作が不安定だったデータ量でも、Rならば動作は常に快適です。
(2)分析手順が残るので、やり直しも簡単
Excelの場合は分析手順は基本的に残らないので、自分で記録を取っておく必要があります。手順の実行は基本的に手動です。
対してRはプログラミング言語なので、当然処理の過程がコードとして全て残ります。どこか間違っていても、そこを修正してまたボタン一つで全ての処理をやってくれる。グラフを描く過程もコードにできます。
(3)最新の分析ツール(アルゴリズム)が使える
Excelはマイクロソフトの製品なので、バージョンアップもマイクロソフト次第です。
対してRはオープンソース。全世界から有志が開発に参加しているので、日々改修が行われています。学会で発表された最新のアルゴリズムも、すぐにパッケージがリリースされ、そのパッケージをインストールしさえすればすぐに使えるようになっています。
http://gendai.ismedia.jp/articles/-/54570
Rは、統計分析に特化したプログラミング言語です。プログラミング言語、というくくりではありますが、統計分析に特化したシンプルな作りになっています。
取っ付きやすさの大きな要因になっているのは、データフレーム、という考え方です。データフレームは列と行という表形式になっていて、Excelで扱うデータ形式と似ているため、Excelに慣れ親しんでいる人であれば、少し使ってみるだけでRに対する違和感はすぐに消えることでしょう。
しかもRは決してマイナーなツールではありません。研究者やデータサイエンティストの間では、分析のツールとして非常にポピュラーです。またRはオープンソースであり、世界中のユーザによって日夜開発が進められ、日々進化しています。
そういうとプロの分析者が使うツールだと思われがちですが、実際にはExcel以上に簡単に、かつExcelだけでは対処が難しい問題を解決できます。フリーのツールなので導入もスムーズです。
さきほどExcelに対してあげた三つの問題点である
・データ量が膨大になると動作が不安定
・一度やった分析を保存できない
・すぐに実行できる分析ツールが限られている
について、Rだとどのように対応しているのかみていきます。
(1)大規模データでも軽快に動く
Excelで扱うことができるデータ量ですが、Excel2013では最大行数は1,048,576行、最大列数は16,384列となっています。ただし、実際にはこれ以下の数十万件レベルで動作が不安定になります。
対してRで扱うことができるデータ数は、1000万行程度×400列であれば、PCのスペックにも依存しますが、たいていは動作も軽快です。Excelでは動作が不安定だったデータ量でも、Rならば動作は常に快適です。
(2)分析手順が残るので、やり直しも簡単
Excelの場合は分析手順は基本的に残らないので、自分で記録を取っておく必要があります。手順の実行は基本的に手動です。
対してRはプログラミング言語なので、当然処理の過程がコードとして全て残ります。どこか間違っていても、そこを修正してまたボタン一つで全ての処理をやってくれる。グラフを描く過程もコードにできます。
(3)最新の分析ツール(アルゴリズム)が使える
Excelはマイクロソフトの製品なので、バージョンアップもマイクロソフト次第です。
対してRはオープンソース。全世界から有志が開発に参加しているので、日々改修が行われています。学会で発表された最新のアルゴリズムも、すぐにパッケージがリリースされ、そのパッケージをインストールしさえすればすぐに使えるようになっています。
http://gendai.ismedia.jp/articles/-/54570
85: 名無しさん@趣味人 2018/03/12(月) 19:15:25.23 ID:kBAmZYFE
>>1
excelだってマクロで処理の過程をコードで記録できるやろ編集もできるし
excelだってマクロで処理の過程をコードで記録できるやろ編集もできるし
140: 名無しさん@趣味人 2018/03/12(月) 21:24:20.28 ID:cU/1dEYl
>>1
この記事書いた馬鹿は誰だ?
言語とアプリを比較すんなよ
この記事書いた馬鹿は誰だ?
言語とアプリを比較すんなよ
2: 名無しさん@趣味人 2018/03/12(月) 17:01:46.66 ID:Pak7tG0q
時代はロータス123
4: 名無しさん@趣味人 2018/03/12(月) 17:05:03.93 ID:NqTRFN/w
その前にアクセスという考えはないのか?
66: 名無しさん@趣味人 2018/03/12(月) 18:39:35.55 ID:+wL59YD5
>>4
それな。
あんまりこの手のプロダクツとか
テクノロジーに詳しくない奴が書いてるのかな。
それな。
あんまりこの手のプロダクツとか
テクノロジーに詳しくない奴が書いてるのかな。
115: 名無しさん@趣味人 2018/03/12(月) 20:03:28.26 ID:sv6cZ+K4
>>4
アクセスは決まったデータでサマリを作るのに適しているけど、明細を細かく都度修正しながら見るのには向かない。Excelはそれができる。それだけ。
アクセスは決まったデータでサマリを作るのに適しているけど、明細を細かく都度修正しながら見るのには向かない。Excelはそれができる。それだけ。
6: 名無しさん@趣味人 2018/03/12(月) 17:07:12.78 ID:EZ9wtn/E
名前がRて…固有名詞なら、もっと検索で識別しやすい名前にすればいいのに
29: 名無しさん@趣味人 2018/03/12(月) 17:24:19.15 ID:Ym1cSlE1
>>6
これ
命名した奴本当バカ
これ
命名した奴本当バカ
87: 名無しさん@趣味人 2018/03/12(月) 19:16:37.09 ID:HfCB3ufZ
>>6
本当にその通りだ。
本当にその通りだ。
124: 名無しさん@趣味人 2018/03/12(月) 20:41:25.96 ID:nvzik2AZ
>>6
へ? Language R で検索すりゃいいじゃん。
へ? Language R で検索すりゃいいじゃん。
8: 名無しさん@趣味人 2018/03/12(月) 17:09:12.42 ID:izXfM2yY
>>1
エクセル貶した「R」ってなんだ
エクセル貶した「R」ってなんだ
10: 名無しさん@趣味人 2018/03/12(月) 17:09:58.07 ID:6AZJsAkD
A3で印字しても見えないくらい縮小されてたら
見る気もしない
見る気もしない
12: 名無しさん@趣味人 2018/03/12(月) 17:10:31.46 ID:jQ9bWXiM
他の言語とどう違うの?
Fortran, Pascal, C, C++, Perl, PHP, Java, Python その他シェルとかいろいろやった俺に
説明してみて
Fortran, Pascal, C, C++, Perl, PHP, Java, Python その他シェルとかいろいろやった俺に
説明してみて
24: 名無しさん@趣味人 2018/03/12(月) 17:20:12.74 ID:REpEctks
>>12
統計処理特化言語
統計処理というのは基本的に複数の処理方法の結果が欲しい
例えば高校生レベルなら
最大、最小、平均、中央値 が欲しくなったりする
この言語だと summary 関数呼び出せばそれらがまとめて一気に手に入る
同様に t検定だと t.test で
p値のみならず信頼区間などよく使う関連性の高いものがまとめて出力される
このように、Rを使うのは統計処理をする関数の中身が
よく使う処理をまとめて行ってくれる手軽さが魅力的な言語だ
統計処理特化言語
統計処理というのは基本的に複数の処理方法の結果が欲しい
例えば高校生レベルなら
最大、最小、平均、中央値 が欲しくなったりする
この言語だと summary 関数呼び出せばそれらがまとめて一気に手に入る
同様に t検定だと t.test で
p値のみならず信頼区間などよく使う関連性の高いものがまとめて出力される
このように、Rを使うのは統計処理をする関数の中身が
よく使う処理をまとめて行ってくれる手軽さが魅力的な言語だ
15: 名無しさん@趣味人 2018/03/12(月) 17:12:29.94 ID:3FrUtBNq
Rは言語であってアプリケーションじゃないだろ そもそも比較するのがおかしい
18: 名無しさん@趣味人 2018/03/12(月) 17:15:09.82 ID:Ixv1fD1i
数十万件レベルのデータをExcelの中に置いたりするのかね
22: 名無しさん@趣味人 2018/03/12(月) 17:18:28.53 ID:6AZJsAkD
>>18
某生保ではやってます
PC処理能力が必要です(でかいとフリーズする)
いろんな観点で分析するので
某生保ではやってます
PC処理能力が必要です(でかいとフリーズする)
いろんな観点で分析するので
25: 名無しさん@趣味人 2018/03/12(月) 17:21:17.52 ID:5diXXeGG
>>22
保険料の払い渋りでボロ儲けしてるんだから、SPSSぐらいサクッと経費で買えよw
保険料の払い渋りでボロ儲けしてるんだから、SPSSぐらいサクッと経費で買えよw
27: 名無しさん@趣味人 2018/03/12(月) 17:23:00.99 ID:6AZJsAkD
>>25
保険金な
保険金な
引用元: ・【IT】Excelはもう古い?ビジネスマン必見のデータ分析最強ツールとは
Amazonプライム・ビデオ無料お試し登録
src="//pagead2.googlesyndication.com/pagead/show_ads.js">