витягувати коментарі з блогу за допомогою jsoup

будь ласка, допоможіть витягати коментарі з блогу, як блогер, використовуючи jsoup

я можу отримати назву, але як витягнути всі коментарі, опубліковані людьми на певній темі обговорення

package com.hascode.samples.jsoup;

import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;

public class WebScraper {
 public static void main(final String[] args) throws IOException {
 Document doc = Jsoup.connect("http://www.hascode.com/")
 .userAgent("Mozilla").timeout(6000).get();
 String title = doc.title();//parsing the page's title
 System.out.println("The title of www.hascode.com is: " + title);
 Elements heading = doc.select("h2 > a");//parsing the latest article's
//heading
 System.out.println("The latest article is: " + heading.text());
 System.out.println("The article's URL is: " + heading.attr("href"));
 Elements editorial = doc.select("div.BlockContent-body small");
 System.out.println("The was created: " + editorial.text());
 }
}

Я намагаюся витягувати коментарі за допомогою Jframe, але вихід не існує. Ось мій код:

public class SimpleWebCrawler extends JFrame {

  JTextField yourInputField = new JTextField(20);
  static JTextArea _resultArea = new JTextArea(100, 100);
  JScrollPane scrollingArea = new JScrollPane(_resultArea);
  private final static String newline = "\n";

  public SimpleWebCrawler() throws MalformedURLException {

    _resultArea.setEditable(false);
    System.out.println("Please enter the website :");
    Scanner scan2 = new Scanner(System.in);
    String word2 = scan2.nextLine();

    try {
      URL my_url = new URL("http://" + word2 + "/");
      BufferedReader br = new BufferedReader(new InputStreamReader(
          my_url.openStream()));
      String strTemp = "";
      while (null != (strTemp = br.readLine())) {
        _resultArea.append(strTemp + newline);
      }
    } catch (Exception ex) {
      ex.printStackTrace();
    }

    _resultArea.append("\n");
    _resultArea.append("\n");
    _resultArea.append("\n");


    String url = "http://" + word2 + "/";
    print("Fetching %s...", url);

    try{
    Document articlePage = Jsoup.connect(url).get();
    Elements comments = articlePage.select(".comments .comment-body");


    System.out.println("\n");

    BufferedWriter bw = new BufferedWriter(new FileWriter("C:\\Users\\user\\fypworkspace\\FYP\\Link\\abc.txt"));
    _resultArea.append("\n");
    for (Element comment : comments) {
      print(" %s ", comment.text());

      bw.write(comment.text());
      bw.write(System.getProperty("line.separator"));
    }
    bw.flush();
    bw.close();
    } catch (IOException e1) {

    }
    JPanel content = new JPanel();
    content.setLayout(new BorderLayout());
    content.add(scrollingArea, BorderLayout.CENTER);

    this.setContentPane(content);
    this.setTitle("Crawled Links");
    this.setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE);

    this.pack();


    }

    private static void print(String msg, Object... args) {

      _resultArea.append(String.format(msg, args) +newline);
    }

    private static String trim(String s, int width) {
      if (s.length() > width)
        return s.substring(0, width - 1) + ".";
      else
        return s;
    }

    //.. Get the content pane, set layout, add to center


  public static void main(String[] args) throws IOException {

    JFrame win = new SimpleWebCrawler();
    win.setVisible(true);

  }
}
1

1 Відповіді

Just open the article page and scrape comments from there. Each comment is one

 • element in
   with class commentsList, so you can get them all like this:

   Document articlePage = Jsoup.connect(heading.attr("href")).get();
   Elements comments = articlePage.select(".commentsList li");
   for (Element comment : comments) {
     System.out.println("Comment: " + comment.text());
   }
   
 • 3
  додано
  @baksteen Не забудьте покращити корисні відповіді та визнати корисну (якщо будь-який), так що майбутні відвідувачі знають, що допомогло!
  додано Автор Dave Newton, джерело
  Елементи comments = articlePage.select (".Comments .comment-body") повинні працювати тут. Загалом, вам потрібно знайти селектор, який вибере лише правильні елементи з дерева DOM.
  додано Автор socha23, джерело
  добре, я намагався, але ось мій приклад блогу, я хочу витягувати коментарі з ...... opinionminingfeedbacks.blogspot.com/p/students-fee‌ dback.html
  додано Автор baksteen, джерело
  Спасибі, що він так добре працював зараз
  додано Автор baksteen, джерело
  ІТ КПІ - Java
  ІТ КПІ - Java
  436 учасників