㈠ 貝葉斯原理及應用
貝葉斯決策理論是主觀貝葉斯派歸納理論的重要組成部分。貝葉斯決策就是在不完全情報下,對部分未知的狀態用主觀概率估計,然後用貝葉斯公式對發生概率進行修正,最後再利用期望值和修正概率做出最優決策。貝葉斯決策理論方法是統計模型決策中的一個基本方法,其基本思想是:1、已知類條件概率密度參數表達式和先驗概率。2、利用貝葉斯公式轉換成後驗概率。3、根據後驗概率大小進行決策分類。他對統計推理的主要貢獻是使用了"逆概率"這個概念,並把它作為一種普遍的推理方法提出來。貝葉斯定理原本是概率論中的一個定理,這一定理可用一個數學公式來表達,這個公式就是著名的貝葉斯公式。 貝葉斯公式是他在1763年提出來的:假定B1,B2,……是某個過程的若干可能的前提,則P(Bi)是人們事先對各前提條件出現可能性大小的估計,稱之為先驗概率。如果這個過程得到了一個結果A,那麼貝葉斯公式提供了我們根據A的出現而對前提條件做出新評價的方法。P(Bi∣A)既是對以A為前提下Bi的出現概率的重新認識,稱 P(Bi∣A)為後驗概率。經過多年的發展與完善,貝葉斯公式以及由此發展起來的一整套理論與方法,已經成為概率統計中的一個冠以「貝葉斯」名字的學派,在自然科學及國民經濟的許多領域中有著廣泛應用。公式:設D1,D2,……,Dn為樣本空間S的一個劃分,如果以P(Di)表示事件Di發生的概率,且P(Di)>0(i=1,2,…,n)。對於任一事件x,P(x)>0,則有: nP(Dj/x)=p(x/Dj)P(Dj)/∑P(X/Di)P(Di)i=1( http://wiki.mbalib.com/w/images/math/9/9/b/.png)貝葉斯預測模型在礦物含量預測中的應用 貝葉斯預測模型在氣溫變化預測中的應用 貝葉斯學習原理及其在預測未來地震危險中的應用 基於稀疏貝葉斯分類器的汽車車型識別 信號估計中的貝葉斯方法及應用 貝葉斯神經網路在生物序列分析中的應用 基於貝葉斯網路的海上目標識別 貝葉斯原理在發動機標定中的應用 貝葉斯法在繼電器可靠性評估中的應用 相關書籍: Arnold Zellner 《Bayesian Econometrics: Past, Present and Future》 Springer 《貝葉斯決策》 黃曉榕 《經濟信息價格評估以及貝葉斯方法的應用》 張麗 , 閆善文 , 劉亞東 《全概率公式與貝葉斯公式的應用及推廣》 周麗琴 《貝葉斯均衡的應用》 王輝 , 張劍飛 , 王雙成 《基於預測能力的貝葉斯網路結構學習》 張旭東 , 陳鋒 , 高雋 , 方廷健 《稀疏貝葉斯及其在時間序列預測中的應用》 鄒林全 《貝葉斯方法在會計決策中的應用》 周麗華 《市場預測中的貝葉斯公式應用》 夏敏軼 , 張焱 《貝葉斯公式在風險決策中的應用》 臧玉衛 , 王萍 , 吳育華 《貝葉斯網路在股指期貨風險預警中的應用》 黨佳瑞 , 胡杉杉 , 藍伯雄 《基於貝葉斯決策方法的證券歷史數據有效性分析》 肖玉山 , 王海東 《無偏預測理論在經驗貝葉斯分析中的應用》 嚴惠雲 , 師義民 《Linex損失下股票投資的貝葉斯預測》 卜祥志 , 王紹綿 , 陳文斌 , 余貽鑫 , 岳順民 《貝葉斯拍賣定價方法在配電市場定價中的應用》 劉嘉焜 , 范貽昌 , 劉波 《分整模型在商品價格預測中的應用》 《Bayes方法在經營決策中的應用》 《決策有用性的信息觀》 《統計預測和決策課件》 《貝葉斯經濟時間序列預測模型及其應用研究》 《貝葉斯統計推斷》 《決策分析理論與實務》
㈡ 關於輸入幾個植物特徵的智能識別系統的貝葉斯網路公式
貝葉斯分類是統計學分類方法。它們可以預測類成員關系的可能性,如給定樣本屬於一個特定類的概率。
樸素貝葉斯分類[2]假定了一個屬性值對給定類的影響獨立於其它屬性的值,這一假定稱作類條件獨立。
設定數據樣本用一個 n 維特徵向量X={x1,x2,,xn}表示,分別描述對n 個屬性A1,A2,,An樣本的 n 個度量。假定有m個類 C1,C2,,Cm 。給定一個未知的數據樣本 X(即沒有類標號),樸素貝葉斯分類分類法將預測 X 屬於具有最高後驗概率(條件 X 下)的類,當且僅當P(Ci | X)> P(Cj | X),1≤j≤m,j≠i 這樣,最大化P(Ci | X)。其中P(Ci | X)最大類Ci 稱為最大後驗假定,其原理為貝葉斯定理:
公式(1)
由於P(X) 對於所有類為常數,只需要P(X | Ci)P(Ci)最大即可。並據此對P(Ci| X)最大化。否則,最大化P(X | Ci)P(Ci)。如果給定具有許多屬性的數據集,計算P(X | Ci)P(Ci)的開銷可能非常大。為降低計算P(X| Ci )的開銷,可以做類條件獨立的樸素假定。給定樣本的類標號,假定屬性值相互條件獨立,即在屬性間,不存在依賴關系,這樣,
公式(2)
概率,可以由訓練樣本估值:
(1) 如果Ak是分類屬性,則P(xk|Ci)=sik/si其中sik是Ak上具有值xk的類Ci的訓練樣本數,而si是Ci中的訓練樣本數。
(2) 如果Ak是連續值屬性,則通常假定該屬性服從高斯分布。因而
公式(3)
其中,給定類Ci的訓練樣本屬性Ak的值, 是屬性Ak的高斯密度函數,而 分別為平均值和標准差。
樸素貝葉斯分類演算法(以下稱為NBC)具有最小的出錯率。然而,實踐中並非如此,這是由於對其應用假定(如類條件獨立性)的不確定性,以及缺乏可用的概率數據造成的。主要表現為:
①不同的檢測屬性之間可能存在依賴關系,如protocol_type,src_bytes和dst_bytes三種屬性之間總會存在一定的聯系;
②當連續值屬性分布是多態時,可能產生很明顯的問題。在這種情況下,考慮分類問題涉及更加廣泛,或者我們在做數據分析時應該考慮另一種數據分析。
後一種方法我們將在以下章節詳細討論。
3 樸素貝葉斯的改進:核密度估計
核密度估計是一種普便的樸素貝葉斯方法,主要解決由每個連續值屬性設為高斯分布所產生的問題,正如上一節所提到的。在[3]文中,作者認為連續屬性值更多是以核密度估計而不是高斯估計。
樸素貝葉斯核密度估計分類演算法(以下稱K-NBC)十分類似如NBC,除了在計算連續屬性的概率 時:NBC是使用高斯密度函數來評估該屬性,而K-NBC正如它的名字所說得一樣,使用高斯核密度函數來評估屬性。它的標准核密度公式為
公式(4)
其中h=σ 稱為核密度的帶寬,K=g(x,0,1) ,定義為非負函數。這樣公式(4)變形為公式(5)
公式(5)
在K-NBC中採用高斯核密度為數據分析,這是因為高斯密度有著更理想的曲線特點。圖1說明了實際數據的概率分布更接近高斯核密度曲線。
圖1 兩種不同的概率密度對事務中數據的評估,其中黑線代表高斯密度,虛線為核估計密度並有兩個不同值的帶寬樸素貝葉斯演算法在計算μc和σc時,只需要存儲觀測值xk的和以及他們的平方和,這對一個正態分布來說是已經足夠了。而核密度在訓練過程中需要存儲每一個連續屬性的值(在學習過程中,對名詞性屬性只需要存儲它在樣本中的頻率值,這一點和樸素貝葉斯演算法一樣)。而為事例分類時,在計算連續值屬性的概率 時,樸素貝葉斯演算法只需要評估g一次,而核密度估計演算法需要對每個c類中屬性X每一個觀察值進行n次評估,這就增加計算存儲空間和時間復雜度,表1中對比了兩種方法的時間復雜度和內存需求空間。
4 實驗研究與結果分析
本節的目標是評價我們提出核密度評估分類演算法對入侵審計數據分類的效果,主要從整體檢測率、檢測率和誤檢率上來分析。
表1 在給定n條訓練事務和m個檢測屬性條件下,
NBC和K-NBC的演算法復雜度
樸素貝葉斯 核密度
時間 空間 時間 空間
具有n條事務的訓練數據 O(nm) O(m) O(nm) O(nm)
具有q條事務的測試數據 O(qm) O(qnm)
4.1 實驗建立
在實驗中,我們使用NBC與K-NBC進行比較。另觀察表1兩種演算法的復雜度,可得知有效的減少檢測屬性,可以提高他們的運算速度,同時刪除不相關的檢測屬性還有可以提高分類效率,本文將在下一節詳細介紹對稱不確定方法[4]如何對入侵審計數據的預處理。我們也會在實驗中進行對比分析。
我們使用WEKA來進行本次實驗。採用 KDDCUP99[5]中的數據作為入侵檢測分類器的訓練樣本集和測試樣本集,其中每個記錄由41個離散或連續的屬性(如:持續時間,協議類型等)來描述,並標有其所屬的類型(如:正常或具體的攻擊類型)。所有數據分類23類,在這里我們把這些類網路行為分為5大類網路行為(Normal、DOS、U2R、R2L、Probe)。
在實驗中,由於KDDCUP99有500多萬條記錄,為了處理的方便,我們均勻從kddcup.data.gz 中按照五類網路行為抽取了5萬條數據作為訓練樣本集,並把他們分成5組,每組數據為10000條,其中normal數據占據整組數據中的98.5%,這一點符合真實環境中正常數據遠遠大於入侵數據的比例。我們首
先檢測一組數據中只有同類的入侵的情況,共4組數據(DOS中的neptune,Proble中的Satan,U2R中的buffer_ overflow,R2l中的guess_passwd),再檢測一組數據中有各種類型入侵數據的情況。待分類器得到良好的訓練後,再從KDD99數據中抽取5組數據作為測試樣本,分別代表Noraml-DOS,Normal-Probe,Normal-U2R,Normal-R2L,最後一組為混後型數據,每組數據為1萬條。
4.2 數據的預處理
由於樸素貝葉斯有個假定,即假定所有待測屬性對給定類的影響獨立於其他屬性的值,然而現實中的數據不總是如此。因此,本文引入對稱不確定理論來對數據進行預處理,刪除數據中不相關的屬性。
對稱不確定理論是基於信息概念論,首先我們先了解一下信息理論念,屬性X的熵為:
公式(6)
給定一個觀察變數Y,變數X的熵為:
公式(7)
P(xi )是變數X所有值的先驗概率,P(xi|yi )是給定觀察值Y,X的後驗概率。這些隨著X熵的降低反映在條件Y下,X額外的信息,我們稱之為信息增益,
公式(8)
按照這個方法,如果IG(X|Y)>IG(X|Y),那麼屬性Y比起屬性Z來,與屬性X相關性更強。
定理:對兩個隨機變數來說,它們之間的信息增益是對稱的。即
公式(9)
對測量屬性之間相關性的方法來說,對稱性是一種比較理想的特性。但是在計算有很多值的屬性的信息增益時,結果會出現偏差。而且為了確保他們之間可以比較,必須使這些值離散化,同樣也會引起偏差。因此我們引入對稱不確定性,
公式(10)
通過以下兩個步驟來選擇好的屬性:
①計算出所有被測屬性與class的SU值,並把它們按降序方式排列;
②根據設定的閾值刪除不相關的屬性。
最後決定一個最優閾值δ,這里我們通過分析NBC和K-NBC計算結果來取值。
4.3 實驗結果及分析
在試驗中,以記錄正確分類的百分比作為分類效率的評估標准,表2為兩種演算法的分類效率。
表2 對應相同入侵類型數據進行檢測的結果
數據集
演算法 DOS
(neptune) Proble
(satan) R2L
( guess_passwd) U2R
(buffer_overflow)
檢測率 誤檢率 整體檢測率 檢測率 誤檢率 整體檢測率 檢測率 誤檢率 整體檢測率 檢測率 誤檢率 整體檢測率
NBC 99.5 0.2 99.79 98.3 0.1 99.84 97.3 0.8 99.2 95 1.8 98.21
K-NBC 99.5 0.2 99.96 98.3 0 99.96 97.3 0.2 99.81 71 0.1 99.76
SU+NBC 99.5 0 99.96 98.3 0.1 99.85 98 0.7 99.24 9 1.1 98.84
SU+K-NBC 99.5 0 99.96 98.3 0 99.96 98.7 0.2 99.76 85 0.1 99.81
根據表2四組不同類別的入侵檢測結果,我們從以下三個方面分析:
(1)整體檢測率。K-NBC的整體檢測率要比NBC高,這是因為K-NBC在對normal這一類數據的檢測率要比NBC高,而normal這一類數據又占整個檢測數據集數的95%以上,這也說明了在上一節提到的normal類的數據分布曲線更加接近核密度曲線。
(2)檢測率。在對DOS和PROBLE這兩組數據檢測結果,兩個演算法的檢測率都相同,這是因為這兩類入侵行為在實現入侵中占絕大部分,而且這一類數據更容易檢測,所以兩種演算法的檢測效果比較接近;針對 R2L檢測,從表2可以看到,在沒有進行數據預處理之前,兩者的的檢測率相同,但經過數據預處理後的兩個演算法的檢測率都有了提高,而K-NBC的效率比NBC更好點;而對U2R的檢測結果,K-NBC就比NBC差一點,經過數據預處理後,K-NBC的檢測率有一定的提高,但還是比NBC的效果差一些。
(3)誤檢率。在DOS和Proble這兩種組數據的誤檢率相同,在其他兩組數據的中,K-NBC的誤檢率都比NBC的低。
根據表3的結果分析,我們也可以看到的檢測結果與表2的分組檢測的結果比較類似,並且從綜合角度來說,K-NBC檢測效果要比NBC的好。在這里,我們也發現,兩種演算法對R2L和U2L這兩類入侵的檢測效果要比DOS和Proble這兩類入侵的差。這主要是因為這兩類入侵屬於入侵行為的稀有類,檢測難度也相應加大。在KDD99競賽中,冠軍方法對這兩類的檢測效果也是最差的。但我們可以看到NBC對這種稀有類的入侵行為檢測更為准確一點,這應該是稀有類的分布更接近正態分布。
從上述各方面綜合分析,我們可以證明K-NBC作為的入侵檢測分類演算法的是有其優越性的。
表3 對混合入侵類型數據進行檢測的結果
數據集
演算法 整體檢測 分類檢測
Normal Dos Proble R2L U2R
檢測率 誤檢率 檢測率 誤檢率 檢測率 誤檢率 檢測率 誤檢率 檢測率 誤檢率 檢測率 誤檢率
NBC 98.14 1.8 98.2 0.8 99.8 0 99.8 0 90 0 86.7 1.8
K-NBC 99.78 0.2 99.8 2.3 99.8 0 99.8 0 96 0 73.3 0.1
SU+NBC 97.99 2.0 98 0.8 99.8 0 99.8 0 90 0 86.7 1.9
SU+K-NBC 99.79 0.2 99.8 1.9 99.8 0 99.8 0 96 0 80 0.1
5 結論
在本文中,我們用高斯核密度函數代替樸素貝葉斯中的高斯函數,建立K-NBC分類器,對入侵行為進行檢測,另我們使用對稱不確定方法來刪除檢測數據的中與類不相關的屬性,從而進一步改進核密度樸素貝葉斯的分類效率,實驗表明,對預處理後的審計數據,再結合K-NBC來檢測,可以達到更好的分類效果,具有很好的實用性。同時我們也注意到,由於入侵檢測的數據中的入侵行為一般為稀有類,特別是對R2L和U2R這兩類數據進行檢測時,NBC有著比較理想的結果,所以在下一步工作中,我們看是否能把NBC和K-NBC這兩種分類模型和優點聯合起來,並利用對稱不確定理論來刪除檢測數據與類相關的屬性中的冗餘屬性,進一步提高入侵檢測效率。
㈢ 求幾本好看的系統流小說,要完本的。謝謝
好看的系統流小說:《全球高武》、《大醫凌然》、《學霸的黑科技系統》、《老衲要還俗》、《星戒》
1、《全球高武》是連載於起點中文網的一部都市異能小說,作者是老鷹吃小雞。小說講述了主角方平重生地球,卻發現身邊的人物沒變,而現實卻是高武模板的地球。武者有著常人沒有的特權,使得世人羨慕,並挖空心思想成為武者。全不知真實的武者都在「陰影」下守護著普通人的安寧。本書2018年7月13日上架,作品扣人心弦,日更過萬,在半個月的時間里《全球高武》勇奪新書榜第三名。
4、《老衲要還俗》,網路作家一夢黃粱所著。這是發生在一個平行世界的故事,主角方正是個小沙彌,自幼被一指廟的老和尚養大,在老和尚去世之後,方正本來想還俗、娶妻、生子,過普通人的生活,卻被一個十分「坑」的佛祖系統綁定,小沙彌方正一時間也就離不開一指廟了,只能修滿功德,符合系統的要求之後才能離開,於是方正從小沙彌一下子升級為了這個小廟的主持,開始為還俗而「奮斗」了。
5、《星戒》是在網上連載的一部都市修真小說,該小說作者是空神。主要講述了普通人林天得到星戒,變得與眾不同後所發生的各種紛紛不一的故事。星戒之中,收藏了十萬多文明世界,普通人林天,得到了神秘的『星戒』,擁有著進入那些世界並帶出物品的能力,一切將變得與眾不同。
㈣ 求給我推薦幾本都市反派流的小說
《我!反派舔狗他爹,專打各種主角》
簡介:穿越平行世界,成為一名人人羨慕的億萬富翁。等等?我人怎麼在醫院?等等,我怎麼還有個便宜兒子?而且他還對一個小家族的女人獻媚?用集團價值數十億的項目,去換取舔她腳的機會?這尼瑪的,劇本怎麼這么眼熟?陳北頓時慌了,這可不是標准活不過三章的反派男配嗎?這是,救音來了!「請宿主選擇服務的系統!」「一、《神級仙帝系統》、與天命主角肩並肩,但有可能被殺死。」「二、《神級修仙系統》,與天命主角一起開局,大概率會被主角殺死,小概率會殺死主角。」「三、《大反派仙帝系統》,與天命主角水火不容,吊打各種不服主角,送一群臭弟弟回爐再造!」
《我真是大反派啊》
簡介:剛才,他退婚了一個修為倒退的廢材,他臨走之前,她大喊「三十年河東三十年河西,莫欺少年窮!」
一年前,他屠了一個小家族,小家族裡唯一逃出生天的人,被仙鶴接走,聽說獲得了仙人傳承。
五年前,他讓家裡奴僕磕頭道歉,那奴僕離開後,聽說很快就覺醒了真龍血脈!
十六年前,他母親把他堂弟的至尊骨移栽到了他身上。
……
類似的事情還有很多。
「蒼天啊,大地啊!不給我金手指,我就找塊豆腐撞死算逑了!」
「叮!你的最強反派系統已上線!請您盡快查收!」
《我成小說的反派》
簡介:他的身份是一個巨富公子,但同時也是這些書里共同的反派炮灰!什麼?掠奪主角的氣運、機緣,可以得到獎勵?掠奪主角的機緣,得到【詠春拳精通】技能獎勵。掠奪主角的氣運,得到神級物品獎勵。主角的一切,都是我的!寧遠憑借對書中劇情的熟悉,一步步搶佔先機,開始了逆襲之路
㈤ 逆概率公式是什麼
公式如下:
首先,所謂的「逆概率公式」指的是貝葉斯公式,是指當分析樣本大到接近總體數時,樣本中事件發生的概率將接近於總體中事件發生的概率。逆概率公式是P(A∩B) = P(A)*P(B|A)=P(B)*P(A|B)。
其實當正著算概率的時候不容易或者不能求出答案,可以從他的相逆的方向考慮,然後用1減去與它相逆的概率值,即得所求概率。
逆概率公式(貝葉斯)特點:
貝葉斯的統計學中有一個基本的工具叫貝葉斯公式、也稱為貝葉斯法則, 盡管它是一個數學公式,但其原理毋需數字也可明了。
如果你看到一個人總是做一些好事,則那個人多半會是一個好人。這就是說,當你不能准確知悉一個事物的本質時,你可以依靠與事物特定本質相關的事件出現的多少去判斷其本質屬性的概率。 用數學語言表達就是:支持某項屬性的事件發生得愈多,則該屬性成立的可能性就愈大。
㈥ 魯棒控制系統模擬
1.熟悉數學軟體MatLab中Statistics工具箱里的各種密度函數和分布函數的作圖命令並觀看各種圖形。
2.會用概率分布函數cdf求各種分布中的不同事件的概率,會用逆概率函數inv求各種分布的α分位點。
背景知識:統計工具箱簡介
統計工具箱是一套建立於Matlab數值計算環境的統調分析工具.能夠支持范圍廣泛的統計計算任務,提供工程和科學統計的基本能力。其中包括200各個M文件(函數),主要文持以下各方面的內容。
•概率分布——提供了20種概率分布類型,其中包括連續分布和離散分布,而且每種分布類型均給出5個有用的函數,即概率密度函數、累積分布因數、逆累積分布函數、隨機數產生器和均值與方差計算函數。
•參數估計——依據特定分布的原始數據,可以計算分布參數的估計值及共置信區間。
•描述性統計——提供描述數據樣本特徵的函數,包括位置和散布的度量、分位數估計和處理數據缺夫情況的函數等。
•線性模型——針對線性模型,工具箱提供的函數涉及單因素方差分析、雙因素方差分析、多重線性回歸、逐步回歸、響應曲面預測和嶺回歸等。
•非線性模型——為非線性模型提供的函數涉及參數估計、多維非線性擬合的交互預測和可視化以及參數和預計值的置信區間計算等。
假設檢驗——此間提供最通用的假設檢驗的函數:t檢驗和z檢驗。
多元統計——關於多元統計的函數有主成分分析和線性判別分析。
統計繪圖——Matlab圖形庫中添加了box圖、正東概率圖、威布爾概率圖分位數與分位數圖等,另外還對多項式擬合和預測的支持進行擴展。
統計工序管理——可繪制通用的管理圖和進行工序性能的研究。
試驗設計——支持因子設計和D優化設計。
統計工具箱的函數主要分為兩類
•數值計算函數
•互動式圖形工具函數
前一類工具由—些函數組成,可以通過命令行或自己的應用程序來調用這些函數。其中很多函數為Matlab的M文件,這些文件由一系列實現特殊統計算注的語句構成。可使用下還語句查看這些函數的代碼
type function_name
也可以將M文件拷貝下米,然後進行修改,形成按您所需要的演算法進行計算的M文件,並將其添加到工具路中。
工具箱所提供的後一類工具是一些能夠通過圖形用戶界面(Gui)來使用的互動式圖形工具。這些基於Gui的工具間時也為多項式擬合和預測以及概率函數介發提供環境。
文中的函數參考或詳解中包含各類函數使用的具體信息。對函數的描述包括函數調用格式、參數選項以及操作符的完整說明。許多函數說明中包括示例、函數演算法的說明以及附加閱讀材料的參考等等。
另外,統計工具箱中的函數所採用的數學符號符合以下慣例
線性模型中的參數
E(x) x的期望值,
f(x|a,b) 概率密度函數(x為獨立變數,a、b為固定參數)
F(x|a,b) 累積分布函數
I[(a,b)] 指示(indicator)函數
P和q P為事件發生的概率,
q為事件不發生的概率,故P=1—q
概率密度函數
對於離散分布和連續分布,其相應的概率密度函數pdf(probility Density Function)
有各自不同的含義。
•離散型隨機變數:它是只有有窮個或可數個可能值的隨機變數,其概率密度函數是
觀察到某特定值的概率。
•連續型隨機變數:如果存在一非負函數p(x)>=0,使對於任意實數a<=b,x在區 間(a,b)上的取值的概率為
則函數p(x)稱作X的概率密度函數,它滿足
=1
與離散分布的pdf不同,其觀察到果一特定值的概率為零
pdf具有兩種性質:
pdf具有兩種性質:
•對於每個可能的結果pdf為零或一正數
pdf對整個區間的積分為1。
pdf並非單一函數,而是由一個或多個參數所表徵的函數族。一旦選定(或估計)了參數值,此函數才唯一確定。
在統計工具箱中,對每種分布的吵函數進行調用的格式是統一的*具體調用格式參見表
下面以正態分布為例,說明pdf函數調用方法。
舉例
x=[—3:0.5:3];
f = normpdf(x,0,1)
f=
Columns l through 7
0.0044 0.0175 0.0540 0.1295 0.2420
0.3521 03989
Columns 8 through 13
0.352l 0.2420 0.1295 0.0540 0.0l 75 0.0044
pdf函數中的第一個參數提供所要計算其概率密度的點集(自變數x);其他參數提供能夠唯一確定分布的參數值,正態分布需要兩個參數:位置參數(均值u)和散度參數(標准差o )。上例中,計算結果變數f則包含了由參數0和1(u=0, =1)所確定的正態分布函數在x取值上的概率密度。
在函數調用時,其小的參數可能是標量(即數量)、矢量或矩陣,出此征給定參數時,需要注意這些參量的長度(或稱尺寸、大小等)席該相匹配。例如, 分布的曲函數調用:P=
betacdf(X,A,B)。其市,x、A和B的長度要麼相向(如,它們都是單個標量,或都為包含N個元素的矢量或N*M個元素的距陣);要麼,其中有的參數(假設為)是單個標量,而其他參量為矢量或矩陣,則MatId自動將X擴展為與其他參量相同長度的矢量或矩陣,此矢
量或矩陣的元素均為常量x的佰。我們稱這種自動操作方式為矢量擴展規則。
舉例:
a=[0.5,0.5]
b=[0.5,1]
c=[0.5,1]
y=betapdf(a,b,c)
y=
0.6366 1.0000
a=[0.5 1; 2 4]
a=
0.5000 1.0000
2.0000 4.0000
y=betapdf(0.5 ,a,a)
y=
0.6366 1.0000
0.5000 2.1875
在其他類似函數中,也通常採用矢量擴展規則對各參量進行操作。以後不再一—贅述。
除了表中列出的特定分布的pdf函數外,統計工具箱還給出了通用的pdf調用函
數,凶數名即為pdf。
pdf
功能:可選分布的通用概率密度函數。
格式:Y=pdf(『name』,X,Al,A2,A3)
說明:Y=pdf(『name』,X,Al,A2,A3)提供了求取統計工具路中任一分布的概率密度值功
能。其中,『na毗』為特定計布的名稱,如『Normal』、』Gamma』等。X為分
布函數的自變數x的取值矩陣,而A1、A2、A3分別為相應的分布參數值。注
意:由於各種分布所含參數不同,A1、A2、A3的含義各不相同,也並不一定
都是必須的;對於任一分布,A1、A2、A3的值具體如何給出,可參見相應分
布的特定概率密度函數。Y存放結果,為概率密度值距陣。
舉例:p = pdf( 『Norma1 『,一2:2,0,1)
p=
0.0540 0.2420 0.3989 0.2420 0.0540
p = pdf(『Poi s son』 , 0:4,1:5)
p=
0.3679 0.2707 0.2240 0.1954 0.1755
函數betapdf()
功能:計算 分布的概率密度函數
語法:Y=betapdf(X,A,B)
說明:
Y=betapdf(A,B) 根據相應的參數A,B計算X中每個值的 分布概率密度。輸入的向量或矩陣X,A,B必須形式相同。標量輸入將被擴展成和其它輸入具有相同維數
的常數短陣或數組。參數A,B必須全部為正,X中的值必須介於0和1之間。
分布概率密度計算。
a=[0.5 1;2 4]
a=
0.5000 1.0000
2.0000 4.0000
y=betapdf(0.5,a,a)
y=
0.6366 1.0000
1.5000 2.1875
函數binopdf ()
功能:計算二項分布的概率密度
語法:Y=binopdf(X,N,P)
說明:
Y=binopdf(X,N,P) 根據相應的參數N,P計算X中每個值的二項分布概率
密度。輸入的向量或矩陣X,N,P必須形式相同。標量輸入將被擴展成和其它輸入具有相
同維數的常數矩陣或數組。參數N必須為正整數,P中的值必須在區間[0,1]上。
一個質量檢驗員每天檢驗500個零件。如果1%的零件有缺陷,一天內檢驗
員沒有發現有缺陷零件的概率是多少?檢驗員發現有缺陷零件的數量最有可能是多少?
計算一天內檢驗員沒有發現有缺陷零件的概率p:
p=binopdf(0,500,0.01)
p=
0. 0066
計算檢驗員發現有缺陷零件的數量:
y=binopdf([0:500],500,0.01);
[x,i]=max(y)
x=
0. 1764
i=
6
因為數組下標i=1時代表發現0個缺陷零件的概率,所以檢驗員發現有缺陷零件的
數量最有可能是i—l=5。
函數exppdf ()
功能:計算指數分布的概率密度函數
語法:Y=exppdf(X,MU)
說明:
Y=exppdf(X,MU) 根據相應的參數MU計算X中每個值的指數分布概率密
度。輸入的向量或短陣X,MU必須形式相同。標量輸入將被擴展成和其它輸入具有相同
維數的常數矩薛或數組。參數MU必須為正數。
指數分布概率密度計算。
y=exppdf(8,1:8)
y=
0.0003 0.0092 0.0232 0.0338 O.0404 0.0439 0.0456 0.0460
y=exppdf(1:8,1:8)
y=
0.3679 0.1839 0.1226 0.0920 0.0736 0.0613 0.0526 0.0460
作圖
畫對數正態分布的概率密度圖
x=(0:0.01:10);
y=lognpdf(x,0,1);
plot(x,y);grid;
xlabel(『\itx』);ylabel(『概率密度\itp』)
畫負二項分布的概率密度圖
x=(0:10);
y=nbinpdf(x,3,0.5);
plot(x,y,』k+』);
xlabel(『\itx』);ylabel(『概率密度\ity』);
set(gca,』Xlim』,[-0.5,10.5])
比較具有相同自由度(V=10)的非中心t分布(非中心參數DELTA=1)和
分布,如圖所示。
x=(-5:0.1:5);
p1=nctpdf(x,10,1);
p=tpdf(x,10);
plot(x,p,'k:',x,p1,'k-')
xlabel('\itx');ylabel('概率密度\itp');
legend('t分布','非中心t分布');
x=(0.01:0.1:10.01);
p1=ncfpdf(x,5,20,10);
p=fpdf(x,5,20);
plot(x,p,'k--',x,p1,'k-');
xlabel('\itx');ylabel('概率密度\itp');
legend('F分布','非中心F分布');
例比較具有相同分子與分母自由度(分別為5和30)的非中心萬分布(參數
=10)和F分布,如圖1l 3所示。
累積分布因數與逆累積分布因數
連續型隨機變數的累積分布函數cdf,亦稱分布函數,完全取決於其概率密度P(x),數學表達式為
F(x)=
如果f是概率密度函數.則相應的累積分布函數(cdf)F為
F(x)=P(X<=x)=
累積分布函數F(x)表示所觀察結果小於或等於x的概率。cdf具有兩種性質:
•cdf值F(x)的范圍為0一1;
.如果y >=x.則F(y)>=F(x)。
逆累積分布函數icdf返回給定顯著概率條件下假設檢驗的臨界位,實際上是cdf的逆函數。
公統計工具箱中,對每種分布的cdf和icdf函數(名稱以inv結尾)進行調用的格式是統
一的 另外, 1:具稍提供了通用的累積分布函數cdf和逆累積分布面數icdf,說明如下。
cdf icdf
功能:計算可選分布的累積分布函數和逆累積分布函數。
格式:P=cdf(『name』,X,A1,A2,A3)
X=icdf(『name』,P,Al,A2.A3)
說明:P=cdf(『name』 X,A1,A2,A3)與pdf函數的區別僅在於它是計算某種分布的累積分
布函數值,而不是概率密度值,其他用法與pdf函數相同。
X=icdf(『name』,P,Al,A2,A3)為P=cdf(』name』,X,A1,A2,A3)的逆函數。
舉例:p=cdf(『Normal』,-2:2,0,1)
p=
0.0228 0.1587 0.500 0 0.84l 3 0.9772
p=cdf(『Poisson』,0:5,1:6)
p=
0.3679 0.40 60 0.4232 0.4335 0.440 5 0.4457
x = icdf( 『Normal』,0.1:0.2:0.9,0,1)
x=
-1.28l 6 -0.5244 0 0.5244 1.28l 6
x=icdf(『Poisson』,0.1:0.2:0.9,1:5)
x=
1 1 3 5 8
下面說明正態分布的cdf函數調用方法
x=[--3:0.1:3];
p=normcdf(x,0,1);
共中,變數P包含出參數0和l所確定的正態分布函數在x中所取值上的累積分布函
數值。所用參數含義與pdf函數類同。
下面說明連續的累積分布函數(cdf)與其逆函數(icdf)的關系。
X= [-3:0.1:3];
xnew = norminv(normcdf(x,0,1), 0,1);
相反地,進行下述計算:
p = [0.1:0.1:0.9];
pnew = normcdf(norminv(p, 0,1),0,1)
請對照一下x與xnew和p與pnew,可以發現其中的規律。
連續分布中取值點的cdf計算值為。0~1的概率值,這些概率值的逆cdf則給出其原來
的取值點。
對於離散分布,cdf與其icdf的關系更為復雜些。因為很可能不存在某個值(設為x)
使得x的cdf為p.在這種情況下,其icdf返回使cdf(x)幸p的第一個值x』。如:
x = [0:10];
y = binoinv[binocdf(x,l 0,0.5), l 0, 0.5];
請對照—下x與y.
以下的命令說明了進行相反操作所同樣存在的問題。
p = [0.1:0.2:0.9];
pnew = binocdf(binoinv(p,l 0, 0.5),l 0, 0.5)
Pnew =
0.1719 0.3770 0.6230 0.828l 0.9453
逆函數在假設檢驗和產生置信區間等工作中是很有用的。以下給出獲得正態分布的99%置信區間的方法。
p= [0.00 5 0.9951
x = norminv(p, 0,l)
x=
-2.5758 2.5758
變數x中的值即為給定概率區間P的條件下,由參數0和1所確定的止態分布函數的逆函數的結果,p(2)-p(1)=0.99.因此,x給出了標准正態分布的99%置信區間。
逆累積分布函數
MATLAB的統計工具箱提供了21種逆累積分布函數,見下表
函數betainv()
功能:求 分布的逆累積分布函數
語法:X=betainv(P,A,B)
說明:
x=betainv(P,A,B) 計算P中概率值的 分布(參數為A和B)逆累積分布函數值。輸入的向量或矩陣P,A,B必須形式相同。標量輸入將被擴展成和其它輸入具有相同維數的矩陣。參數A,B必須全部為正,P中的值必須位於區間[0,1]上。
給定概率P和參數a和b的戶分布的逆累積分布值為
其中
B()為犀函數。輸出結果x中每一個元素是這樣一個值,它服從由參數為a和b定義的分布,且其累積分布值為P中相應的概率值。
計算P分布逆分布函數示例。
P=[0.01 0.5 0.991
x=betainv(p,10,5)
x=
0.3726 0.6742 0.8981
由上面的結果可以看出,對於參數a=10,b=5的雇分布,小於或等於0.3726的值出現的概率為0.0l。類似地,小於或等於0.6742和0.8981的值出現的概率為0.5和0.99。
函數binoitnv()
功能:求二項分布的逆累積分布函數
語法:x=binoinv(Y,N,P)
說明:
X=binoiv(Y,N,P) 退回二項累積分布值大於或等於Y的最小的整數值X。
可以認為Y是在N次重復獨立試驗中事件成功X次的概率,其中對於任意給定的一次試驗成功的概率為P。X中的每個值都是小於或等於N的正整數。
輸入的向量或短陣Y,N,P必須是形式相同。標量輸入將被擴展成和其它輸入具有相同維數的常數矩陣。參數N必須為正整數,P和Y中的值必須位於區間[0,1]上。
如果一個棒球隊在一個賽季中有162場比賽,任意一場比賽獲勝的機會都為50%.那麼這支球隊在一個賽季中獲勝場次的合理范圍為多少?假定不可思議的結果
10年才偶然出現一次。
binoinv([0.05 0.95],162,0.5)
ans=
71 91
結果表示這支球隊在一個賽季中90%的范圍內,獲勝的場次在71和9l之間。
函數expinv()
功能:求指數分布的逆累積分布函數
語法;x=expinv(P,MU)
說明:
x=expinv(P,MU) 計算P中概率值的指數分布(參數為MU)逆累積分布值。
輸入的向量或矩陣P,MU必須形式相同。標量輸入將被擴展成和其它輸入具有相同維數的常數矩陣。參數MU必須為正數,P中的值必須位於區間[0,1]上。
指數分布的逆累積分市函數定義為
結果x是表示這樣一個值,它服從參數為 的指數分布且落在區間[0,x]上的概率為P。
假定燈泡的奉命服從參數 P=700明日數分布,那麼燈泡壽命的中位數是多少?
expinv(0.50,700)
ans=
485.2030
因此,假定買了一箱燈泡,如果700小時是燈泡的平均壽命,那麼一半燈泡將在不超過500小時時就會燒掉。
函數chi2inv()
功能;求 分布的逆累積分市函數
語法;X=chi2inv(P,V)
說明:
x=chi2inv(P,V) 計算P中概率值的 分布(參數為V)逆累積分布函數值。
輸入的向量或矩陣P,V必須形式相同。標量輸入將被擴展成和其它輸入具有相同維數的常數矩陣。自由度參數V必須為正整數,P中的值必須位於區間[0,1]上。
給定概率P和自由度參數 的 分布的逆累積分布值為
其中
()為 函數。輸出結果x中每一個元素是這樣一個值,它服從由參數 定義的分布,且其累積分布值為P中相應的概率值。
例 找出一個超過95%樣本值的數,其中樣本服從自由度為10的 分布
x=chi2inv(0.95,10)
x=
18.3070
由上面的結果可以發現大於18.3的數只有5%的出現機會
函數morminv()
功能:計算正態分布的逆累積分布面數
語法:x=norminv(P,MU,SIGMA)
說明:
x=norminv(P,MU,SIGMA) 計算P中概率值的正態分布(參數為MU和SIGMA)逆累積分布函數值。輸入的向量或矩陣P,MU和SIGMA必須形式相同。標量輸入將被擴展成和其它輸入具有相同維數的常數矩陣。SIGMA中的參數值必須為正數,
P中的值必須位於區間[0,1]上。
正態分布的逆累積分布函數定義為
其中
結果x為上面積分等式的解.其中P被賦予想得到的概率值。
例 找一個區間,使它包含95%的標准正態分布的值。
x=norminv([0.025 0.975],0,1)
x=
-1.9600 1.9600
注意區間x不是惟一符合條件的區間,但它是最小的。
x1=norminv([0.01 0.96],0,1)
x1=
-2.3263 1.7507
區間x1也包含了95%的概率值,但它要比x要大。
函數poissnv()
功能:計算泊松分布的逆累積分布函數
語法:x=poiesinv(P,LAMBDA)
說明:
X=poissinv(P,LAMBDA) 返回泊松累積分布值大於或等於P的最小的正整數X。輸入的向量或矩陣P和LAMBDA必須形式相同,輸出X也和它們形式相同。標量輸入將被擴展成和其它輸入具有相同繼數的常數矩陣。參數LAMBDA必須為正數。
例 由某商店過去的銷售記錄知道,某種商品每月的銷售數可以用歲數 =25的泊松分布來描述,為了有95%以上的把握不使商品脫銷,問商店在每月月底應進該種商品多少件?
Poissinv(0.95,25)
ans=
33
㈦ 貝葉斯公式是不是逆概率公式
對。後驗概率被貝葉斯本人稱作「逆概率」,貝葉斯公式就是用來求「逆概率」的一個公式,國內習慣叫「逆概公式「
㈧ 什麼是逆概率
概率分布是概率論的基本概念之一,用以表述隨機變數取值的概率規律。為了使用的方便,根據隨機變數所屬類型的不同,概率分布取不同的表現形式
㈨ 求一些主角帶金手指,或系統的小說
星際雜貨鋪
死靈術士闖異界,穿越到魔獸世界,帶著暗黑中的死靈法師技能,連載中
神鬼劍士,帶著DNF穿越異界,連載中
國王萬歲,帶著暗黑游戲穿越異界當國王,連載中
門派養成日誌,帶著游戲系統穿越到修真世界當掌門,完本
追女養成系統,都市數據流,主角帶著戀愛養成系統,連載中
暗黑之骷髏王,穿越到暗黑世界中,主角只會招骷髏一個技能,連載中
最強教皇,主角和游戲之神契約,可以兌換東西,完本
神牧師,帶著類似魔獸世界牧師的技能穿越到異界,完本
暗黑無敵,帶著英雄無敵的城堡穿越到暗黑世界中,連載中
英雄無敵之十二翼天使,重生網游小說,但寫的不錯,完本
琥珀之劍,帶著游戲系統穿越到異界,連載中
穿越暗黑破壞神,帶著魔獸爭霸中的光環和物品穿越到暗黑世界成為死靈法師,完本
暗黑之野蠻神座,帶著大還丹穿越到暗黑中成為野蠻人,完本
蓮花寶鑒,一個可憐的男人帶著一個印記穿越到異界做善事的故事,完本
這些都是我跟著看下來的,感覺還不錯,還有好多想不起來了
虛擬穿越,末世重生帶游戲系統。
給最佳吧。
還有就是高樓大廈最新的那一步,
好像叫 叱吒風雲 唐僧志 (一個游戲玩家帶著游戲角色的功能重生在西遊記的世界)
異世鋒芒(易空來到了一個和游戲世界極為相似的異界,他有著游戲人物中的各種技能)
天命法神(普通的都市青年獲得了UFO異寶。他的人生,被同化成了游戲一般的詳細數據)
蓮花寶鑒(可憐的男人拚命去做善事,行善積德,積攢那麼一點點的仙家願力升級蓮花 )
多塔奇緣(帶著秘法指環重生多塔大陸,努力升級)
異界瞬發法神(穿越男努力解封導致他穿越的罪魁禍首——青銅耳釘 )
重裝之異界重生(偶然的機會,神靈把杜康從《征服》游戲中帶到異界)
貌似高手在異界(楚南:我是全游戲第一高手 伺服器:靠!全伺服器就你一個人 )
無敵紅警在異界(一個帶著紅色警戒穿越異界的傢伙的故事)
練級狂人在異界(穿越後,許文發現曾經的游戲經驗和煉葯知識在這陌生世界居然可以使用)
夢想的輪回世界(降臨在夢想大陸新手小鎮的帕斯特,將怎樣開始自己的傳奇之旅呢……)
穿越暗黑破壞神(帶著魔獸技能降臨暗黑,強大的光環亡靈法師究竟能夠到達什麼程度)
異界之狂暴進化(一個游戲測試員穿越了,卻發現自己獲得了游戲角色技能)
白金農民麻煩哥(一款用星球作為伺服器的真實游戲,完全真實的世界,要是你,你會怎麼玩?)
傳奇法師異界縱橫(《傳奇》中一NPC魔法師由於系統錯誤,穿越到劍與魔法的世界......)
魔獸多塔之異世風雲(這是一部以魔獸爭霸游戲多塔為背景的異世大陸穿越小說)
仙俠世界的真實游戲(一個游戲狂人,帶著一枚儲物戒指穿越到了仙俠的世界)
英雄無敵之大航海時代(玩游戲居然穿越到游戲世界,那麼好吧,升級吧)
未完:
全能奇才(任何技能一學就會,提升熟練度,便能站在最巔峰!)
叱吒風雲(乾勁被天空飛來的一頂帽子給砸暈了……靠!這玩意不就是地球的網路游戲頭盔!)
超級搜鬼儀(高漸飛獲得了一款可以搜索現實鬼魂,虛擬鬼魂的軟體,從此之後……)
重生在仙游世界(田宇重生了,身體廢柴的他重生到了一個仙俠的世界,在這里他意外的發現,即
是不需要修煉也能修仙(升級),他的長生之路開始了...)
重生之我能升級( 一位青年意外重生,結果卻發現自己居然可以升級!)
重生官場之人品系統(吳天重生後,身攜的人品系統不僅鑒定標准錯漏百出,更是開啟不計其數的
荒誕任務。) 先說這些吧!一時也找不起那 么多!!希望樓主能採納!謝謝!
㈩ 大學概率統高手進 男人中有5%是色盲患者女人中有0.25%男女22:21要詳細解答過程哦!正確 滿意 先到 必加
解:A1={男人} A2={女人} B={色盲}。
P(B)=P(A1B)+P(A2B)
=P(A1)P(B|A1)+P(A2)P(B|A2)
=0.5*5%+0.5*0.25%
=21/800
P(A1|B)=P(A1B)|P(B)=(1/40)/(21/800)=20/21
簡介
概率,亦稱「或然率」,它是反映隨機事件出現的可能性大小。隨機事件是指在相同條件下,可能出現也可能不出現的事件。例如,從一批有正品和次品的商品中,隨意抽取一件,「抽得的是正品」就是一個隨機事件。
設對某一隨機現象進行了n次試驗與觀察,其中A事件出現了m次,即其出現的頻率為m/n。經過大量反復試驗,常有m/n越來越接近於某個確定的常數(此論斷證明詳見伯努利大數定律)。該常數即為事件A出現的概率,常用P (A) 表示。