Skip to content

RStudioでWordCloud

授業アンケートからワードクラウドを描く手順をメモしました。授業は学生にどんな印象を残したかを知りたい、それを学生と共有したいと思ったため。

Homebrewで準備(初回だけ)

TerminalでRとRStudioをインストール、日本語ワードマイニングのパッケージをインストール、日本語辞書も

$ brew install r
$ brew install --cask r
$ brew install mecab
$ brew install mecab-ipadic

アンケート結果の準備

  • アンケート結果のExcelファイルから、使いたい語句をTextEditCopy & Paste
  • Format>Make Plain Text
  • 保存
  • Finderで保存先のパスを確認する。Command + iで情報をみる。パスの情報にマウスオーバー、Right-clickCopy as Pathname

RStudio

#ライブラリをインストール(初回だけ、時間が掛かる)
install.package("wordcloud2")
install.packages("RMeCab", repos = "http://rmecab.jp/R")

#ライブラリをアクティブにする
library(wordcloud2)
library(RMeCab)

#テキストファイルを読み込み、と同時に頻度を調べて「MCB」に格納
#パスをペースト。パスに日本語があっても通った
MCB <-RMeCabFreq("/Users/(username)/Documents/Rstudio/words/biology5th_utf8.txt")

#並べ替えして「WC」に格納し、ワードクラウドを描く
#回転は控えめの設定、Viewerは十分大きく表示しておくこと
WC <- MCB[order(MCB$Freq, decreasing=T),]
wordcloud2(WC[,c("Term","Freq")], minRotation = -pi/12, maxRotation = -pi/12)

メモ

  • たとえば「知的好奇心」は、知的と好奇心に分かれて集計される。困るほどではないけれど、用語が分解されやすい。性能が良い証拠?辞書のせい?

(2023.5.18 iMac2017_Corei7, MBP2021_M1max)