大阪ハイテクのブログを解析してみた
大阪ハイテクは開校から40年近い歴史ある学校✨️
その中で、日々発信しているブログの総数は、なんと約3000本❣
高校生の皆さんを中心に、大阪ハイテクで目指せる職業について知ってもらったり、興味を持ってほしい!
という思いで、色んな先生が時間をかけて執筆しています!
今回は、そんな大阪ハイテクのブログを、AIとプログラムを駆使して解析したので紹介します😎
データを集める「Webクローリング」
Webクローリングとは、「インターネット上の情報収集をプログラムで自動化すること」です。
色んなサイトの情報を集めて比較したいとき、とても手間がかかります。これをプログラムで自動化することでラクになります!
クローリングは人工知能学科の授業でも扱う内容の一つなんですよ😊
ご注意!
クローリングは便利ですが、クローリング先のサーバーに負荷をかけます。今回の解析は専門家がサーバー負荷を考慮して実施していますので、皆さんは真似しないでください。 |
ハイテクブログのデータの量は?
クローリングしてきたデータは、テキストのみで5,387kBありました。これは、ざっくり計算で約270万文字です🫨
小説など、文庫本の文字数が約10万文字と言われているので、ハイテクのブログ記事だけで27 冊くらいの量になります!
読みやすく、途中で飽きない記事とは?
ひたすら長い文章を書いても、読む側は疲れてしまいますよね。。
そのため、ハイテクのブログは見出しやイラストを入れて話題を区切ることで、読みやすくなるよう工夫しています!
文字数のヒストグラムも出してみました。
ブログ記事は500~1000文字程度が読みやすいと言われており、ハイテクブログはそれをきちんと守っています!
AIの力でもっと良いブログ記事を書ける!?
専用の解析ツールを使うと、途中で読み飽きてないか、ブログ記事からオープンキャンパスに興味を持ってくれたかなどのデータが取れます!
解析ツールだけでなく、ブログ自体とこういったデータをAIが学習することで、どんなブログが皆さんの役に立つか探れる可能性があります。
AIを作るとなれば、人工知能学科の学生の出番ですね😎面白いテーマになりそうです!
余談 ~AIが書くブログ記事はまだまだこれから~
ブログ記事を書くAI技術が登場しています!
色々試してみましたが、残念ながらありきたりな内容ばかりで、実用にはまだまだ難しいレベルでした😢
なので、これからも先生たちが熱意と愛情のこもった記事で、高校生の皆さんの進路選びに役立つ情報をどんどん発信していきます!
お楽しみに😁
AI・ITだけでなく3Dのデザイン技術やロボット開発も学べる、人工知能学科のオープンキャンパスはこちらの画像リンクから!