亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術文章
文章詳情頁

python 實現樸素貝葉斯算法的示例

瀏覽:4日期:2022-07-09 13:02:40

特點

這是分類算法貝葉斯算法的較為簡單的一種,整個貝葉斯分類算法的核心就是在求解貝葉斯方程P(y|x)=[P(x|y)P(y)]/P(x) 而樸素貝葉斯算法就是在犧牲一定準確率的情況下強制特征x滿足獨立條件,求解P(x|y)就更為方便了 但基本上現實生活中,沒有任何關系的兩個特征幾乎是不存在的,故樸素貝葉斯不適合那些關系密切的特征

from collections import defaultdictimport numpy as npfrom sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_splitfrom loguru import loggerclass NaiveBayesScratch(): '''樸素貝葉斯算法Scratch實現''' def __init__(self): # 存儲先驗概率 P(Y=ck) self._prior_prob = defaultdict(float) # 存儲似然概率 P(X|Y=ck) self._likelihood = defaultdict(defaultdict) # 存儲每個類別的樣本在訓練集中出現次數 self._ck_counter = defaultdict(float) # 存儲每一個特征可能取值的個數 self._Sj = defaultdict(float) def fit(self, X, y): ''' 模型訓練,參數估計使用貝葉斯估計 X: 訓練集,每一行表示一個樣本,每一列表示一個特征或屬性 y: 訓練集標簽 ''' n_sample, n_feature = X.shape # 計算每個類別可能的取值以及每個類別樣本個數 ck, num_ck = np.unique(y, return_counts=True) self._ck_counter = dict(zip(ck, num_ck)) for label, num_label in self._ck_counter.items(): # 計算先驗概率,做了拉普拉斯平滑處理,即計算P(y) self._prior_prob[label] = (num_label + 1) / (n_sample + ck.shape[0]) # 記錄每個類別樣本對應的索引 ck_idx = [] for label in ck: label_idx = np.squeeze(np.argwhere(y == label)) ck_idx.append(label_idx) # 遍歷每個類別 for label, idx in zip(ck, ck_idx): xdata = X[idx] # 記錄該類別所有特征對應的概率 label_likelihood = defaultdict(defaultdict) # 遍歷每個特征 for i in range(n_feature): # 記錄該特征每個取值對應的概率 feature_val_prob = defaultdict(float) # 獲取該列特征可能的取值和每個取值出現的次數 feature_val, feature_cnt = np.unique(xdata[:, i], return_counts=True) self._Sj[i] = feature_val.shape[0] feature_counter = dict(zip(feature_val, feature_cnt)) for fea_val, cnt in feature_counter.items(): # 計算該列特征每個取值的概率,做了拉普拉斯平滑,即為了計算P(x|y) feature_val_prob[fea_val] = (cnt + 1) / (self._ck_counter[label] + self._Sj[i]) label_likelihood[i] = feature_val_prob self._likelihood[label] = label_likelihood def predict(self, x): ''' 輸入樣本,輸出其類別,本質上是計算后驗概率 **注意計算后驗概率的時候對概率取對數**,概率連乘可能導致浮點數下溢,取對數將連乘轉化為求和 ''' # 保存分類到每個類別的后驗概率,即計算P(y|x) post_prob = defaultdict(float) # 遍歷每個類別計算后驗概率 for label, label_likelihood in self._likelihood.items(): prob = np.log(self._prior_prob[label]) # 遍歷樣本每一維特征 for i, fea_val in enumerate(x): feature_val_prob = label_likelihood[i] # 如果該特征值出現在訓練集中則直接獲取概率 if fea_val in feature_val_prob: prob += np.log(feature_val_prob[fea_val]) else: # 如果該特征沒有出現在訓練集中則采用拉普拉斯平滑計算概率 laplace_prob = 1 / (self._ck_counter[label] + self._Sj[i]) prob += np.log(laplace_prob) post_prob[label] = prob prob_list = list(post_prob.items()) prob_list.sort(key=lambda v: v[1], reverse=True) # 返回后驗概率最大的類別作為預測類別 return prob_list[0][0]def main(): X, y = load_iris(return_X_y=True) xtrain, xtest, ytrain, ytest = train_test_split(X, y, train_size=0.8, shuffle=True) model = NaiveBayesScratch() model.fit(xtrain, ytrain) n_test = xtest.shape[0] n_right = 0 for i in range(n_test): y_pred = model.predict(xtest[i]) if y_pred == ytest[i]: n_right += 1 else: logger.info('該樣本真實標簽為:{},但是Scratch模型預測標簽為:{}'.format(ytest[i], y_pred)) logger.info('Scratch模型在測試集上的準確率為:{}%'.format(n_right * 100 / n_test))if __name__ == '__main__': main()

以上就是python 實現樸素貝葉斯算法的示例的詳細內容,更多關于python實現樸素貝葉斯算法的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 国产成人综合高清在线观看 | 国产国拍亚洲精品av | 午夜精品久久久久久久 | 一区二区三区四区无限乱码 | aaaaaa毛片免费看 | 涩色涩 | 91精品国产免费久久久久久青草 | 久久国产精品超级碰碰热 | 亚洲日韩第一页 | 精品免费在线 | 黄色一级毛片看一级毛片 | 欧美日韩顶级毛片www免费看 | 成人特黄午夜性a一级毛片 成人爱av18丰满 | 黑人的逼| 亚洲欧美日韩成人一区在线 | 国产亚洲精品久久午夜 | 国产黑丝在线播放 | 性色午夜视频免费男人的天堂 | 在线观看国产一区亚洲bd | 青草青青产国视频在线 | japanese色系国产在线高清 | 性生活免费大片 | 免费网站看v片在线成人国产系列 | 婷婷性| 亚洲精品色一区二区三区 | 一级做一级爱a做片性视频视频 | 草草免费 | 美国一级毛片∞ | 一级毛片特级毛片国产 | 亚洲毛片在线 | 国产精品极品美女自在线看免费一区二区 | 日韩精品永久免费播放平台 | 91精品国产91久久久久久 | 久久亚洲国产精品一区二区 | 久久久日韩精品国产成人 | 亚洲国产日韩a在线亚洲 | 亚洲最黄视频 | 国产成人a∨麻豆精品 | 日本成aⅴ人片日本伦 | 在线观看视频一区二区 | 2048国产精品原创综合在线 |