소프트웨어 개발/Java - Basic

Jsoup 이용해서 쉽게 html 파싱하기

늘근이 2014. 5. 20. 14:12

정적인 html만 파싱이 가능하다는것 잊지말고 (나중에 비동기나 등등으로 추가된 웹페이지는 돌려지지 않는다. 이건 웹브라우저를 이용해서 돌려야 하는 것임.)


Connection con = Jsoup.connect("");

Document document = con.get();

System.out.println(document);


이런식으로 써주면 이제 jQuery에서 쓰듯이 쉽게 쓸수 있다.


첨부파일로 일단 Jsoup을 추가하고 나머지 라이브러리는 참고용으로 HttpClient등이다. 정말 필요한기능은 jsoup하나뿐이다.



commons-logging-1.1.3.jar


httpclient-4.3.3.jar


httpcore-4.3.2.jar


jsoup-1.7.3.jar