文章詳情頁

Python通過m3u8文件下載合并ts視頻的操作

瀏覽：5日期：2022-06-22 11:57:34

前段時間，接到一個需求，要求下載某一個網站的視頻，然后自己從網上查閱了相關的資料，在這里做一個總結。

1. m3u8文件

m3u8是蘋果公司推出一種視頻播放標準，是一種文件檢索格式，將視頻切割成一小段一小段的ts格式的視頻文件，然后存在服務器中（現在為了減少I/o訪問次數，一般存在服務器的內存中），通過m3u8解析出來路徑，然后去請求，是現在比較流行的一種加載方式。目前，很多新聞視頻網站都是采用這種模式去加載視頻。

M3U8文件是指UTF-8編碼格式的M3U文件。M3U文件是記錄了一個索引純文本文件，打開它時播放軟件并不是播放它，而是根據它的索引找到對應的音視頻文件的網絡地址進行在線播放。原視頻數據分割為很多個TS流，每個TS流的地址記錄在m3u8文件列表中。

下面就是m3u8文件的格式。

#EXTM3U#EXT-X-VERSION:3#EXT-X-MEDIA-SEQUENCE:0#EXT-X-ALLOW-CACHE:YES#EXT-X-TARGETDURATION:15#EXTINF:6.916667,out000.ts#EXTINF:10.416667,out001.ts#EXTINF:10.416667,out002.ts#EXTINF:1.375000,out003.ts#EXTINF:1.541667,out004.ts#EXTINF:7.666667,out005.ts#EXTINF:10.416667,2. ts文件處理

只有m3u8文件，需要下載ts文件

ts文件能正常播放，但太多而小，需要合并有ts文件

但因為被加密無法播放，需要解碼

在這里我只記錄下前兩個步驟，因為，我目前研究的比較少，還沒有遇到ts被加密的情況。

3. 分析舉例

那么下面，我就正式舉一個網站，第一財經網（直接點擊）跟大家正式的講解下。

這是該網站的視頻。如下圖：

Python通過m3u8文件下載合并ts視頻的操作

點擊第一個視頻，這就是我們這次要爬取的視頻。

Python通過m3u8文件下載合并ts視頻的操作

然后鼠標右鍵點擊，選擇'檢查' 或者按F12鍵，進入開發者模式，查看網頁代碼。

然后，點擊Network ，再點擊other，尋找請求地址中帶有m3u8和ts標記的請求地址。

不懂，請看下圖。有一點，很重要。網站通過切割后ts加載視頻，并不是沒有規律的，而是通過m3u8文件附帶的。也就說，網站一定是先加載m3u8文件，然后根據m3u8文件，去請求ts文件。所以，如果你找不到m3u8文件的話，你可以先找第一個ts文件，然后往上面翻，一定能找到m3u8文件。

Python通過m3u8文件下載合并ts視頻的操作

再點擊這個m3u8文件，右側對應的就是它的請求地址。

Python通過m3u8文件下載合并ts視頻的操作

請求地址如下：

https://ycalvod.yicai.com/record/live/cbn/ca233887-1443-4bdf-b762-3b4b3a217085_LD.m3u8?auth_key=1575703722-0-0-6f09e9a156491f027a035e31c238c48c&ycfrom=yicaiwww

你可以把上面那個地址，輸入瀏覽器地址框內，下載下來。也可以通過查看源碼，找到該功能的對應的html代碼。

這是下載下來的m3u8文件。

Python通過m3u8文件下載合并ts視頻的操作

從圖片可以看出來，每一個ts文件都是相對的地址，所以下面我們就需要找到絕對地址。

Python通過m3u8文件下載合并ts視頻的操作

ts文件地址如下：

https://ycalvod.yicai.com/record/live/cbn_yld/1575111614_3446078.ts

上面，我們已經把這個網站的視頻加載模式分析的很透徹，下面就開始擼代碼了。

4. 獲取ts文件

def getTsUrl(): ts_url_list = [] baseUrl = 'https://ycalvod.yicai.com/record/live' with open('ca233887-1443-4bdf-b762-3b4b3a217085_LD.m3u8', 'r', encoding='utf-8') as f:m3u8Contents = f.readlines()for content in m3u8Contents: if content.endswith('tsn'):ts_Url = baseUrl + content.replace('n', '').replace('..', '')ts_url_list.append(ts_Url)print(ts_Url) return ts_url_list5. 下載ts文件

def download_ts_video(download_path, ts_url_list): download_path = r'C:UsersAdministratorDesktopAiShu下載視頻TS視頻' for i in range(len(ts_url_list)):ts_url = ts_url_list[i]try: response = requests.get(ts_url, stream=True, verify=False)except Exception as e: print('異常請求：%s' % e.args) returnts_path = download_path + '{}.ts'.format(i)with open(ts_path, 'wb+') as file: for chunk in response.iter_content(chunk_size=1024):if chunk: file.write(chunk) print('TS文件下載完畢！！')

這就是我本地下載好的ts切割視頻

Python通過m3u8文件下載合并ts視頻的操作

6. 合并TS視頻

def heBingTsVideo(download_path,hebing_path): all_ts = os.listdir(download_path) with open(hebing_path, ’wb+’) as f:for i in range(len(all_ts)): ts_video_path = os.path.join(download_path, all_ts[i]) f.write(open(ts_video_path, ’rb’).read()) print('合并完成！！')

最后的結果如下：

Python通過m3u8文件下載合并ts視頻的操作

7. 完整的代碼

有興趣的小伙伴，可以研究下。

import requests,osdef getTsUrl(): ts_url_list = [] baseUrl = 'https://ycalvod.yicai.com/record/live' with open('ca233887-1443-4bdf-b762-3b4b3a217085_LD.m3u8', 'r', encoding='utf-8') as f:m3u8Contents = f.readlines()for content in m3u8Contents: if content.endswith('tsn'):ts_Url = baseUrl + content.replace('n', '').replace('..', '')ts_url_list.append(ts_Url)print(ts_Url) return ts_url_listdef download_ts_video(download_path, ts_url_list): download_path = r'C:UsersAdministratorDesktopAiShu下載視頻TS視頻' for i in range(len(ts_url_list)):ts_url = ts_url_list[i]try: response = requests.get(ts_url, stream=True, verify=False)except Exception as e: print('異常請求：%s' % e.args) returnts_path = download_path + '{}.ts'.format(i)with open(ts_path, 'wb+') as file: for chunk in response.iter_content(chunk_size=1024):if chunk: file.write(chunk) print('TS文件下載完畢！！')def heBingTsVideo(download_path,hebing_path): all_ts = os.listdir(download_path) with open(hebing_path, ’wb+’) as f:for i in range(len(all_ts)): ts_video_path = os.path.join(download_path, all_ts[i]) f.write(open(ts_video_path, ’rb’).read()) print('合并完成！！')if __name__ == ’__main__’: download_path = r'C:UsersAdministratorDesktopAiShu下載視頻TS視頻' hebing_path = r'C:UsersAdministratorDesktopAiShu下載視頻合并TS視頻第一財經.mp4' ts_url_list = getTsUrl() download_ts_video(download_path, ts_url_list) heBingTsVideo(download_path,hebing_path)

以上為個人經驗，希望能給大家一個參考，也希望大家多多支持好吧啦網。如有錯誤或未考慮完全的地方，望不吝賜教。

Python 編程

上一條：Python中Jupyter notebook快捷鍵總結下一條：Python實現Telnet自動連接檢測密碼的示例

相關文章：

1. ASP常用日期格式化函數 FormatDate()2. Python數據相關系數矩陣和熱力圖輕松實現教程3. 什么是Python變量作用域4. 開發效率翻倍的Web API使用技巧5. bootstrap select2 動態從后臺Ajax動態獲取數據的代碼6. CSS3中Transition屬性詳解以及示例分享7. js select支持手動輸入功能實現代碼8. Java xml數據格式返回實現操作9. vue使用moment如何將時間戳轉為標準日期時間格式10. python 如何在 Matplotlib 中繪制垂直線

排行榜

					
					Python數據相關系數矩陣和熱力圖輕松實現教程
如何在PHP中讀寫文件
vue-drag-chart 拖動/縮放圖表組件的實例代碼
PHP正則表達式函數preg_replace用法實例分析
Java xml數據格式返回實現操作
php redis setnx分布式鎖簡單原理解析
Django使用channels + websocket打造在線聊天室
一個 2 年 Android 開發者的 18 條忠告
Spring @Primary和@Qualifier注解原理解析
Vue實現仿iPhone懸浮球的示例代碼
vue將data恢復到初始狀態 && 重新渲染組件實例