接著上一篇, 這次我們定位更精準一點
假設我這次只要"食道癌你必須知道的五個小知識"這個標題
程式碼跟上次的上半部相同
import requests
from bs4 import BeautifulSoup as BS
res = requests.get('http://tn00343140a.pixnet.net/blog')
res.encoding='utf-8'
soup = BS(res.text,'html.parser')
接著觀察一下網頁結構
我們可以發現, 他在id="article-269827824"底下
如果我直接定位, 會得到什麼資料呢?
import requests
from bs4 import BeautifulSoup as BS
res = requests.get('http://tn00343140a.pixnet.net/blog')
res.encoding='utf-8'
soup = BS(res.text,'html.parser')
print(soup.find(id='article-269827824').text)
得到這樣的結果 :
但是我只想要標題啊? 再加上些條件吧! 比如 h2 tag
import requests
from bs4 import BeautifulSoup as BS
res = requests.get('http://tn00343140a.pixnet.net/blog')
res.encoding='utf-8'
soup = BS(res.text,'html.parser')
print(soup.find(id='article-269827824').h2.text)
結果就直接拿到了
本來我還想加上a tag的, 還是給大家看一下有啥不一樣吧!!!!!
import requests
from bs4 import BeautifulSoup as BS
res = requests.get('http://tn00343140a.pixnet.net/blog')
res.encoding='utf-8'
soup = BS(res.text,'html.parser')
print(soup.find(id='article-269827824').h2.a.text)
結果.......
當然是一樣囉!~!~