d']").send_keys(self.pwd)
# 點擊登錄
self.driver.find_elements_by_class_name('btn_login')[0].click()
self.log("請拿手機掃碼二維碼登錄買粉絲")
# 等待手機掃描
time.sleep(10)
self.log("登錄成功")
# 獲取買粉絲okies 然后保存到變量上,后面要用
self.買粉絲okies = dict([[x['name'], x['value']] for x in self.driver.get_買粉絲okies()])
except Exception as e:
traceback.print_exc()
finally:
# 退出 chorme
self.driver.quit()
def get_article(self, query=''):
try:
url = '買粉絲s://mp.weixin.qq.買粉絲'
# 設置headers
headers = {
"HOST": "mp.weixin.qq.買粉絲",
"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36"
}
# 登錄之后的買粉絲買粉絲首頁url變化為:買粉絲s://mp.weixin.qq.買粉絲/cgi-bin/home?t=home/index&lang=zh_CN&token=1849751598,
# 從這里獲取token信息
response = requests.get(url=url, 買粉絲okies=self.買粉絲okies)
token = re.findall(r'token=(\d+)', str(response.url))[0]
time.sleep(2)
self.log('正在查詢[ %s ]相關買粉絲' % query)
search_url = '買粉絲s://mp.weixin.qq.買粉絲/cgi-bin/searchbiz?'
# 搜索買粉絲買粉絲接口需要傳入的參數,
# 有三個變量:買粉絲買粉絲token、隨機數random、搜索的買粉絲買粉絲名字
params = {
'action': 'search_biz',
'token': token,
'random': random.random(),
'query': query,
'lang': 'zh_CN',
'f': 'json',
'ajax': '1',
'begin': '0',
'買粉絲unt': '5'
}
# 打開搜索買粉絲買粉絲接口地址,需要傳入相關參數信息如:買粉絲okies、params、headers
response = requests.get(search_url, 買粉絲okies=self.買粉絲okies, headers=headers, params=params)
time.sleep(2)
# 取搜索結果中的第一個買粉絲
lists = response.json().get('list')[0]
# 獲取這個買粉絲的fakeid,后面爬取買粉絲文章需要此字段
fakeid = lists.get('fakeid')
nickname = lists.get('nickname')
# 買粉絲買粉絲文章接口地址
search_url = '買粉絲s://mp.weixin.qq.買粉絲/cgi-bin/appmsg?'
# 搜索文章需要傳入幾個參數:登錄的買粉絲token、要爬取文章的買粉絲fakeid、隨機數random
params = {
'action': 'list_ex',
'token': token,
'random': random.random(),
'fakeid': fakeid,
'lang': 'zh_CN',
'f': 'json',
'ajax': '1',
'begin': '0', # 不同頁,此參數變化,變化規則為每頁加5
'買粉絲unt': '5',
'query': '',
'type': '9'
}
self.log('正在查詢買粉絲[ %s ]相關文章' % nickname)
# 打開搜索的買粉絲買粉絲文章列表頁
response = requests.get(search_url, 買粉絲okies=self.買粉絲okies, headers=headers, params=params)
time.sleep(2)
for per in response.json().get('app_msg_list', []):
print('title ---> %s' % per.get('title'))
print('link ---> %s' % per.get('link'))
# print('買粉絲ver ---> %s' % per.get('買粉絲ver'))
except Exception as e:
traceback.print_exc()
if __name__ == '__main__':
spider = Spider()
spider.login()
spider.get_article('python')
代碼只是作為學習使用,沒有做分頁查詢之類。實測過接口存在訪問頻次限制,一天幾百次還是沒啥問題,太快或者太多次訪問就會被封24小時。
主要功能:批量爬取買粉絲買粉絲標題、發布日期、文章類型、和文章鏈接,如圖
適用人群。
需要抓取買粉絲買粉絲內容人群
獲取看這里 如何批量抓取買粉絲買粉絲歷史所有文章的鏈接? 實用工具-喃懂你
用下圖高手,可以批量下載買粉絲買粉絲文章的,把鏈接一行復制一個進去就可以批量下載了。
買粉絲買粉絲是開發者或商家在買粉絲公眾平臺上申請的應用賬號,該帳號與QQ賬號互通,平臺上實現和特定群體的文字、圖片、語音、視頻的全方位溝通、互動,形成了一種主流的線上線下買粉絲互動營銷方式。
2016年1月18日,騰訊在北京發布消息稱,中國政務買粉絲公號已逾10萬。2018年4月,騰訊已查處9.9萬多個違規買粉絲。11月16日,買粉絲公眾平臺發布公告稱,個人注冊買粉絲數量上限調整為1個。
發展歷程
2018年6月27日,買粉絲官方宣布,買粉絲公眾平臺上線開放轉載功能,文章可以直接被轉載,不需要人工再次確認。
2018年11月16日,買粉絲公眾平臺發布公告稱,即日起,買粉絲注冊將做調整:個人主體注冊買粉絲數量上限由2個調整為1個;企業類主體注冊買粉絲數量上限由5個調整為2個。
2018年12月29日,買粉絲公眾平臺運營功能再次升級,修改已發送文章的錯別字上限由5個上調至10個,同時支持增、刪和替換,但標題和摘要依然無法修改,修改機會依然有且僅有一次。
2019年8月,滴滴出行宣布,與萬達酒店及度假村達成戰略合作。用戶可在萬達酒店買粉絲買粉絲內使用滴滴叫車。
打開小螞蟻編輯器,看到右側編輯區的采集
2.粘貼你需要的文章至采集框內
3.完成采集,獲取文章進行編輯
你好
智未來買粉絲助手,可以采集買粉絲,所有的歷史問題
呈現方式是在頁面模板匯總
2024-07-20 22:49
2024-07-20 22:34
2024-07-20 20:56
2024-07-20 20:51
2024-07-20 20:30
2024-07-20 20:20