【Exploratory】アンチ結合を使ってみる

Exploratory
Exploratory準備記事
関連記事

【やりたいこと】アンチ結合を使用して、重要でない単語を表示しないようにしたい!

過去記事の「【Exploratory】TwitterSearchを使用してみる」のなかで、重要でない単語を表示しないようにフィルターをかけました。一つ一つ単語を記入し、フィルターをかけることは、正直、めんどくさかったです。

このめんどくさい作業を一瞬で行うExploratoryハックがありましたので紹介します!

【10分でできる】アンチ結合を使用

※ダウンロード時間は10分の中に含まれていません。

1.使用したもの

・Exploratory

Exploratory
Data Science is not just for Engineers and Statisticians. Exploratory makes it for Everyone.

・Mecab

・Rmecab

2.手順

①データフレームの追加

データフレームの+マークをクリックし、ファイルデータをクリックします。

リモートを選択し、テキストファイル(CSV等の区切りファイル)をクリックします。

Remote File URLの蘭に下記のURLをコピペします。

https://raw.githubusercontent.com/exploratory-io/public/master/stopwords/twitter_stopwords.csv

このURLは、Exploratoryのサイトで用意された、重要でない単語をあつめたものになります。

保存をクリックします。

データフレームの名前を決めて、作成をクリックします。

②アンチ結合による重要でない単語の非表示

.tokenのメニューから結合をクリックします。

結合タイプの▼マークをクリックし、アンチ結合をクリックします。

結合先データフレームをtwitter_stopwords(重要でない単語をあつめたもの)に変更、

結合先の例をwordに変更します。

変更後、実行をクリックします。

以上のように行うことで、重要でない単語が表示されないようになりました。

3.追記

アンチ結合は、データフレーム同士を結合させ、重複したものを非表示にするということかな。

【最後に】参考サイトの紹介

参考記事は、Exploratoryのサイトにあるブログを見ています。以下のリンクが、日本語に対応しており、とっつきやすいのでおすすめです。

Exploratory
Find great insights or how-to guides on Exploratory's Insight Discovery Page.

コメント

タイトルとURLをコピーしました