RStudioでWordCloud

授業アンケートからワードクラウドを描く手順をメモしました。授業は学生にどんな印象を残したかを知りたい、それを学生と共有したいと思ったため。

Homebrewで準備（初回だけ）

TerminalでRとRStudioをインストール、日本語ワードマイニングのパッケージをインストール、日本語辞書も

$ brew install r
$ brew install --cask rstudio
$ brew install mecab
$ brew install mecab-ipadic

アンケート結果の準備

アンケート結果のExcelファイルから、使いたい語句をTextEditへCopy & Paste
Format>Make Plain Text
保存
Finderで保存先のパスを確認する。Command + iで情報をみる。パスの情報にマウスオーバー、Right-click、Copy as Pathname

RStudio

#ライブラリをインストール（初回だけ、時間が掛かる）
install.package("wordcloud2")
install.packages("RMeCab", repos = "http://rmecab.jp/R")

#ライブラリをアクティブにする
library(wordcloud2)
library(RMeCab)

#テキストファイルを読み込み、と同時に頻度を調べて「MCB」に格納
#パスをペースト。パスに日本語があっても通った
MCB <-RMeCabFreq("/Users/(username)/Documents/Rstudio/words/biology5th_utf8.txt")

#並べ替えして「WC」に格納し、ワードクラウドを描く
#回転は控えめの設定、Viewerは十分大きく表示しておくこと
WC <- MCB[order(MCB$Freq, decreasing=T),]
wordcloud2(WC[,c("Term","Freq")], minRotation = -pi/12, maxRotation = -pi/12)

メモ

たとえば「知的好奇心」は、知的と好奇心に分かれて集計される。困るほどではないけれど、用語が分解されやすい。性能が良い証拠？辞書のせい？

(2023.5.18 iMac2017_Corei7, MBP2021_M1max)