RStudioでWordCloud
授業アンケートからワードクラウドを描く手順をメモしました。授業は学生にどんな印象を残したかを知りたい、それを学生と共有したいと思ったため。
Homebrewで準備(初回だけ)
Terminal
でRとRStudioをインストール、日本語ワードマイニングのパッケージをインストール、日本語辞書も
$ brew install r
$ brew install --cask rstudio
$ brew install mecab
$ brew install mecab-ipadic
アンケート結果の準備
- アンケート結果の
Excel
ファイルから、使いたい語句をTextEdit
へCopy
&Paste
Format
>Make Plain Text
- 保存
Finder
で保存先のパスを確認する。Command + i
で情報をみる。パスの情報にマウスオーバー、Right-click
、Copy as Pathname
RStudio
#ライブラリをインストール(初回だけ、時間が掛かる)
install.package("wordcloud2")
install.packages("RMeCab", repos = "http://rmecab.jp/R")
#ライブラリをアクティブにする
library(wordcloud2)
library(RMeCab)
#テキストファイルを読み込み、と同時に頻度を調べて「MCB」に格納
#パスをペースト。パスに日本語があっても通った
MCB <-RMeCabFreq("/Users/(username)/Documents/Rstudio/words/biology5th_utf8.txt")
#並べ替えして「WC」に格納し、ワードクラウドを描く
#回転は控えめの設定、Viewerは十分大きく表示しておくこと
WC <- MCB[order(MCB$Freq, decreasing=T),]
wordcloud2(WC[,c("Term","Freq")], minRotation = -pi/12, maxRotation = -pi/12)
メモ
- たとえば「知的好奇心」は、知的と好奇心に分かれて集計される。困るほどではないけれど、用語が分解されやすい。性能が良い証拠?辞書のせい?
(2023.5.18 iMac2017_Corei7, MBP2021_M1max)