Python之爬蟲初探(三)－張郎生活的筆記

接著上一篇, 這次我們定位更精準一點

擷取.PNG

假設我這次只要"食道癌你必須知道的五個小知識"這個標題

程式碼跟上次的上半部相同

import requests
from bs4 import BeautifulSoup as BS

res = requests.get('http://tn00343140a.pixnet.net/blog')
res.encoding='utf-8'
soup = BS(res.text,'html.parser')

接著觀察一下網頁結構

擷取.PNG

我們可以發現, 他在id="article-269827824"底下

如果我直接定位, 會得到什麼資料呢?

import requests
from bs4 import BeautifulSoup as BS

res = requests.get('http://tn00343140a.pixnet.net/blog')
res.encoding='utf-8'
soup = BS(res.text,'html.parser')

print(soup.find(id='article-269827824').text)

得到這樣的結果 :

擷取.PNG

但是我只想要標題啊? 再加上些條件吧! 比如 h2 tag

import requests
from bs4 import BeautifulSoup as BS

res = requests.get('http://tn00343140a.pixnet.net/blog')
res.encoding='utf-8'
soup = BS(res.text,'html.parser')

print(soup.find(id='article-269827824').h2.text)

結果就直接拿到了

擷取.PNG

本來我還想加上a tag的, 還是給大家看一下有啥不一樣吧!!!!!

import requests
from bs4 import BeautifulSoup as BS

res = requests.get('http://tn00343140a.pixnet.net/blog')
res.encoding='utf-8'
soup = BS(res.text,'html.parser')

print(soup.find(id='article-269827824').h2.a.text)

結果.......

當然是一樣囉!~!~

擷取.PNG

張郎屋

張郎生活的筆記

張郎屋發表在痞客邦留言(0) 人氣()

E-mail轉寄

張郎生活的筆記

每件事都有解決方法, 只是你可能還不知道而已

Python之爬蟲初探(三)

歷史上的今天

留言列表

參觀人氣

站方公告

活動快報

天海旅...

我的好友

熱門文章

文章分類

最新文章

最新留言

動態訂閱

文章精選

文章搜尋

誰來我家

QR Code

POWERED BY