スクレイピングとは、HTML文書から自分のほしい部分のみ切り抜くことです。Visual Studioを使ったWindowsフォームでHTML文書をダウンロードするシステムを様々コントロールを使って、正規表現を用いながら、海外の新聞のタイトルと英文本文を取り出すシステムを開発できます。例えば、スクレイピングした文章をサーバーに自動投稿して、一定時間ごとにリストのタイトルを更新ながら、SQLサーバなどのデータベースにスクレイピングした文書を保存するシステムが開発できます。その文章を読んだら、何語読んだか統計情報などを記録しておく機能も付け加えたら、英文多読ツールとして実用性のあるプログラムになるのではないかと思います。自動的に英文をスクロールする機能を作ることで、英文を帰り読みしなく英語を英語のまま理解できる学習アプリシステムの開発も可能です。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です