Exploratory準備記事

【Exploratory】Exploratoryのインストール
【やりたいこと】Exploratoryを使ってみたい! Twitterの検索キーワードを取得できないか調べていたら、Exploratoryというサービスを発見しました。 Exploratoryを一言で説明すると、データサイエンスの民...

【Exploratory】MecabとRmecabのインストール方法
Exploratory準備記事 【やりたいこと】ツイートデータをテキストマイニングしたい、その前にMecabとRmecabをインストールしよう! まずは、MecabとRmecabのインストールです。簡単です。サクッと...
関連記事
【やりたいこと】アンチ結合を使用して、重要でない単語を表示しないようにしたい!
過去記事の「【Exploratory】TwitterSearchを使用してみる」のなかで、重要でない単語を表示しないようにフィルターをかけました。一つ一つ単語を記入し、フィルターをかけることは、正直、めんどくさかったです。
このめんどくさい作業を一瞬で行うExploratoryハックがありましたので紹介します!
【10分でできる】アンチ結合を使用
※ダウンロード時間は10分の中に含まれていません。
1.使用したもの
・Exploratory

Exploratory
Data Science is not just for Engineers and Statisticians. Exploratory makes it for Everyone.
・Mecab
・Rmecab
2.手順
①データフレームの追加
データフレームの+マークをクリックし、ファイルデータをクリックします。
リモートを選択し、テキストファイル(CSV等の区切りファイル)をクリックします。
Remote File URLの蘭に下記のURLをコピペします。
https://raw.githubusercontent.com/exploratory-io/public/master/stopwords/twitter_stopwords.csv
このURLは、Exploratoryのサイトで用意された、重要でない単語をあつめたものになります。
保存をクリックします。
データフレームの名前を決めて、作成をクリックします。
②アンチ結合による重要でない単語の非表示
.tokenのメニューから結合をクリックします。
結合タイプの▼マークをクリックし、アンチ結合をクリックします。
結合先データフレームをtwitter_stopwords(重要でない単語をあつめたもの)に変更、
結合先の例をwordに変更します。
変更後、実行をクリックします。
以上のように行うことで、重要でない単語が表示されないようになりました。
3.追記
アンチ結合は、データフレーム同士を結合させ、重複したものを非表示にするということかな。
【最後に】参考サイトの紹介
参考記事は、Exploratoryのサイトにあるブログを見ています。以下のリンクが、日本語に対応しており、とっつきやすいのでおすすめです。

Exploratory
Find great insights or how-to guides on Exploratory's Insight Discovery Page.
コメント