文章詳情頁

利用python 讀寫csv文件

瀏覽：3日期：2022-07-11 16:17:21

1、讀文件

import csv csv_reader = csv.reader(open('data.file', encoding='utf-8'))for row in csv_reader: print(row)

csv_reader把每一行數據轉化成了一個list，list中每個元素是一個字符串。

2、寫文件

讀文件時，我們把csv文件讀入列表中，寫文件時會把列表中的元素寫入到csv文件中。

list = ['1', '2', '3', '4']out = open(outfile, 'w')csv_writer = csv.writer(out)csv_writer.writerow(list)

可能遇到的問題：直接使用這種寫法會導致文件每一行后面會多一個空行。

解決辦法如下：

out = open(outfile, 'w', newline='')csv_writer = csv.writer(out, dialect='excel')csv_writer.writerow(list)

在stackoverflow上找到了比較經典的解釋，原來 python3里面對 str和bytes類型做了嚴格的區分，不像python2里面某些函數里可以混用。所以用python3來寫wirterow時，打開文件不要用wb模式，只需要使用w模式，然后帶上newline=’’。

3、示例

簡單讀寫

import csv class writer: def __init__(self): self.dict = { '標題': '標題', '鏈接': '鏈接', '服務': '服務', 'dsr': 'dsr', '店鋪名': '店鋪名', '價格': '店鋪名', '付款人數': '付款人數', '發貨地': '發貨地', } out = open('outfile.csv', 'w', newline='') self.csv_writer = csv.writer(out, dialect='excel') self.csv_writer.writerow(self.dict) def writer_to(self, key_value): self.csv_writer.writerow(key_value) if __name__ == '__main__': a = writer() new = { '鏈接': 'http://www.baidu.com', '標題': '我是標題', } a.dict.update(new) print(a.dict) a.writer_to(a.dict.values()) 結合爬蟲

import csvfrom selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECfrom selenium.common.exceptions import TimeoutException, NoSuchElementExceptionfrom selenium.webdriver.common.action_chains import ActionChains driver = ['1', '2']colspan = ['1', '2']try: out = open('類目.csv', 'w', newline='')except PermissionError: print('文件被其他程序占用') input('')csv_writer = csv.writer(out, dialect='excel')csv_writer.writerow(['寶貝ID', '類目']) def open_chrome(): driver[0] = webdriver.Chrome() driver[0].get('https://www.dianchacha.com') input('請登陸后按回車:') def EC_located(one_group, value): ''' 目的：簡化代碼長度，參數1選擇one或者group切換選中模式 :param value:要找的值【CSS選擇器】 :return:選擇到的對象 ''' wait = WebDriverWait(driver[0], 10) if one_group == 'one': try: ecl = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, value))) return ecl except TimeoutException: print(value, '1元素未加載成功，等待超時') else: try: ecl = wait.until(EC.presence_of_all_elements_located((By.CSS_SELECTOR, value)) ) return ecl except TimeoutException: print(value, '1元素---組---未加載成功，等待超時') def operating(ID): # 先獲取ID輸入框 driver[0].get('https://www.dianchacha.com/item/info/index/iid/' + ID) html = driver[0].page_source if '未能找到親的寶貝' not in html: colspans = EC_located('group', '.colspan-1') colspan[0] = str(colspans[1].text).replace('寶貝類目： ', '') else: return operating(ID) print(colspan) def writer_txt(): csv_writer.writerow([url[0], colspan[0]]) print('保存', url[0], colspan[0], '成功') url = ['0', '1'] def main(): open_chrome() file = '寶貝ID.txt' with open(file) as f: for line in f.readlines(): url[0] = line print(line) operating(url[0]) writer_txt() out.close() print('已完成') if __name__ == '__main__': main()

以上就是利用python 讀寫csv文件的詳細內容，更多關于python 讀寫csv文件的資料請關注好吧啦網其它相關文章！

Python 編程

上一條：Python 必須了解的5種高級特征下一條：如何用Python 加密文件

相關文章：

1. html小技巧之td,div標簽里內容不換行2. 使用css實現全兼容tooltip提示框3. 詳解盒子端CSS動畫性能提升4. CSS hack用法案例詳解5. 告別AJAX實現無刷新提交表單6. CSS Hack大全-教你如何區分出IE6-IE10、FireFox、Chrome、Opera7. 讀大數據量的XML文件的讀取問題8. 詳解瀏覽器的緩存機制9. HTML DOM setInterval和clearInterval方法案例詳解10. XML入門的常見問題(一)

排行榜

					
					Docker容器如何更新打包并上傳到阿里云
JavaScript實現通訊錄功能
JetBrains IntelliJ IDEA 配置優化技巧
IDEA編譯亂碼Build Output提示信息亂碼
詳解瀏覽器的緩存機制
Django結合使用Scrapy爬取數據入庫的方法示例
asp中response.write("中文")或者js中文亂碼問題
告別AJAX實現無刷新提交表單
ASP腳本組件實現服務器重啟
PHP設計模式中工廠模式深入詳解
快速解決ajax返回值給外部函數的問題