スポンサーリンク

KotlinでJSoupを使ってスクレイピングしてみる

IntelliJ IDEAでJSoupを使ってみる。

全くやったことがないので導入だけのメモになる。

プログラム

コードは以下の通り。

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;


fun main(args: Array<String>) {

    val url = "https://suzulang.com/"
    val doc = Jsoup.connect(url).get();

    println(doc.title());  // タイトル取得

    // divの内容をリストで取得
    val divs = doc.select("div");
    for(div in divs){

        // div に子要素があればその内容をループ
        if( div.children().size > 0 ){

            // pの一覧を取得
            val paragraphs = div.children().select("p");
            for(p in paragraphs){

                println(p.text()); // pの内容を表示

            }
        }
    }
}

IntelliJでJSoupを導入する方法

以下からダウンロード

https://jsoup.org/download

展開したら、[File]→[Project Structure...]を選択

Dependenciesの中の+をクリックし、JARs or Directories...を選択

jsoup-1.15.4.jarファイルへのフルパスを指定。ディレクトリまでしか指定しないとjarファイルが表示されないので入力欄にファイル名まで全部入力するといい。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)


この記事のトラックバックURL: