close

接著上一篇, 這次我們定位更精準一點

擷取.PNG

假設我這次只要"食道癌你必須知道的五個小知識"這個標題

程式碼跟上次的上半部相同

import requests
from bs4 import BeautifulSoup as BS

res = requests.get('http://tn00343140a.pixnet.net/blog')
res.encoding='utf-8'
soup = BS(res.text,'html.parser')

接著觀察一下網頁結構

擷取.PNG

我們可以發現, 他在id="article-269827824"底下

如果我直接定位, 會得到什麼資料呢?

import requests
from bs4 import BeautifulSoup as BS

res = requests.get('http://tn00343140a.pixnet.net/blog')
res.encoding='utf-8'
soup = BS(res.text,'html.parser')

print(soup.find(id='article-269827824').text) 

 

得到這樣的結果 :

 

擷取.PNG

但是我只想要標題啊? 再加上些條件吧! 比如 h2 tag

import requests
from bs4 import BeautifulSoup as BS

res = requests.get('http://tn00343140a.pixnet.net/blog')
res.encoding='utf-8'
soup = BS(res.text,'html.parser')

print(soup.find(id='article-269827824').h2.text) 

結果就直接拿到了

擷取.PNG

本來我還想加上a tag的, 還是給大家看一下有啥不一樣吧!!!!!

import requests
from bs4 import BeautifulSoup as BS

res = requests.get('http://tn00343140a.pixnet.net/blog')
res.encoding='utf-8'
soup = BS(res.text,'html.parser')

print(soup.find(id='article-269827824').h2.a.text) 

結果.......

當然是一樣囉!~!~

擷取.PNG

 

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 張郎屋 的頭像
    張郎屋

    張郎生活的筆記

    張郎屋 發表在 痞客邦 留言(0) 人氣()