文章詳情頁

python 讀取以空格分開的文件操作

更多 QQ空间微信 QQ好友腾讯朋友复制链接

【字号：大中小】作者：豬豬瀏覽：31日期：2022-06-22 10:58:36

在查找數據集的時候發現，并不是所有的數據集都是以csv的格式存儲，也就是每一列特征數據的分割并不是都以逗號分割，有的數據格式是以空格為分割

例如.data格式，

接下來就實現對.data格式數據的讀取：

(數據來源于Boston房價預測數據集，文件名稱為“housing.data”)

import pandas as pddata = pd.read_csv(’./housing.data’, delim_whiteshape=True)

以上代碼就是實現了對空格的分割，但是不知道針對也是以一列存儲，并且數據分割也是空格的csv文件此方法還行得通不。

另外pd.read_csv()中的參數sep和delimiter表示的意義一樣，具體如何使用不清楚，目前用到不多。

遇到讀取文件不知如何操作的，最后要訪問下官方文檔或者google查詢。

pd.read_csv官方文檔

另外，可以直接在原數據集文件加后綴名.csv即可轉換成csv文件，但前提是data中的數據已經以，分割好了。

pd.read_csv()中讀取文件時，默認第一行作為列名，但有時候第一行也是我們需要的數據，這時需制定參數header=None，或者給每列提前設置好名字，names=[‘column0’,‘column1’,…]

補充：python 實現以空格分隔的文件讀寫及二維數組按列折半查找

最近文件讀寫的工作比較多，每一次讀文件都會寫單獨的函數來適應文件格式，所以寫了一個類對文件進行操作。

（用pandas.read_csv讀取文件更好用）

import osclass DealData: # 數據加載函數 def load(self, filename):data = []file = open(filename, ’r’)for line in file.readlines(): line = line.strip(’n’) # 除去換行 line = line.split(’ ’) # 文件以“ ”分隔 if '' in line: # 解決每行結尾有空格的問題line.remove('') data.append(line)file.close()return data # 折半查找 # array是一個二維數組，函數實現的功能是按照array的第lie列折半查找 def search(self, array, lie, target):low = 0high = len(array) - 1while array[low][lie] <= array[high][lie]: mid = int((low + high) / 2) midval = array[mid][lie] if midval < target:low = mid + 1 elif midval > target:high = mid - 1 if high < 0 or low >= len(array):breakreturn high # 將數據保存到文件 def save(self, data, filename):file = open(filename, ’w’)for i in range(0, len(data), 1): for k in range(0, len(data[i]), 1):file.write(str(data[i][k]))file.write(' ') file.write('n')file.close()

可以將Dealdata類單獨創建一個python文件，命名為Dealdata，調用方法如下：

from DealData import DealData deal = DealData()totaldata = deal.load('E:low_data.txt')

之前先引用類：from Dealdata import Dealdata，其中第一個Dealdata為被調用的python文件名，第二個Dealdata為被調用的類名。

以上為個人經驗，希望能給大家一個參考，也希望大家多多支持好吧啦網。如有錯誤或未考慮完全的地方，望不吝賜教。

Python 編程

上一條：Python 通過分隔符分割文件后按特定次序重新組合的操作下一條：Python 如何將字符串每兩個用空格隔開

相關文章：

1. Django ORM實現按天獲取數據去重求和例子2. Jsp中request的3個基礎實踐3. XML入門的常見問題(一)4. jsp EL表達式詳解5. 解決ajax的delete、put方法接收不到參數的問題方法6. IntelliJ IDEA 統一設置編碼為utf-8編碼的實現7. idea修改背景顏色樣式的方法8. chat.asp聊天程序的編寫方法9. IntelliJ IDEA設置自動提示功能快捷鍵的方法10. 怎樣才能用js生成xmldom對象，并且在firefox中也實現xml數據島？

排行榜

					
					IntelliJ IDEA設置自動提示功能快捷鍵的方法
IntelliJ IDEA配置Tomcat服務器的方法
IntelliJ IDEA 統一設置編碼為utf-8編碼的實現
idea修改背景顏色樣式的方法
怎樣才能用js生成xmldom對象，并且在firefox中也實現xml數據島？
chat.asp聊天程序的編寫方法
Jsp中request的3個基礎實踐
解決ajax的delete、put方法接收不到參數的問題方法
XML入門的常見問題(一)
jsp EL表達式詳解
IntelliJ IDEA刪除類的方法步驟