ツイートを分析して頻出する単語を表示するサイト「Janome」を作りました

形態素解析ライブラリのJanomeを使用して、Twitterの分析をするサイトです。

Janome – ツイートを分析し、頻出する単語をピックアップするサイト

 

サイト名はライブラリの名前と同様の「Janome」となっています。

 

ツイートを分析してみたら、面白いことがわかるのではないかというところから出発して、アカウントの直近のツイートから、単語をピックアップするサイトを作りました。

機械学習の勉強を始めてから、グラフで可視化するだけでも見え方が変わると知ったので、簡単にデータを見えるようなサイトにしました。

 

こちらがロゴデザインです。蛇の目が瞬きしているようなデザインにしました。

 

サイトのデザインは、ダンボールのようなクラフト紙っぽい背景にしました。表示するグラフが目立つように、単色にしています。

 

使用方法は、フォームにTwitterのアカウント名を入力するだけです。簡単!

鍵垢でないなら、どのアカウントでも分析することができます。

入力すると、プロフィールとグラフ、上位の単語をそのアカウントを表すキーワードとして表示します。

こうやって見てみると普段、どんなことをつぶやく傾向にあるのかわかって面白いです。

 

スポンサードサーチ



技術的な話

今回使用したフレームワーク・ライブラリ・環境についてです。

フレームワーク

  • Flask

Pythonで規模の小さいアプリケーションで DBも使わないなら、Flaskがいいと思います。

Djangoでもいいのですが、やりたいことはシンプルですぐに試したかったので、触ったことのあるこちらにしました。

 

ライブラリ

このサイトの肝となる部分を担うライブラリです。

Janomeは使いやすく、例も多いので形態素解析の中身を把握していなくても使うことができます。(詳しいことはおいおい勉強します。)

とりあえず試してみたいという方にもおすすめです。

 

サーバー

Heroku

Herokuはこちらでも試しましたが、すごく使いやすいです。

Webスクレイピング+Flaskでwebサービスを制作するまでにやったこと

2018年10月9日

ただ、無料で動かすと速度的には微妙です。でもまずは無料で色々やりたかったので、出来るだけコードを修正したり、オブジェクトをdeleteしたりとメモリを減らす方に注力しました。

Flaskで早く動かすにはdyno一つでは厳しいかもしれません。

Railsで爆速で動くサイトがあるみたいなので、Rubyにも手を出していきたい。余裕があれば。