网站的几种主要推广方式:问答式SNS式等
一、问答式
问答式网站推广主要是针对几个比较大的门户网站的问答,主要有新浪爱问,雅虎知识堂,天涯问答,百度知道,腾讯问问,进行这种问答推广前提是要有这些网站的账号,每个网站最少要有5个账号,多则不限。密码要统一,便于记忆。
另外,还要注意:1.同一时间,同一地点传播同一种人群。2.考虑消费者的意愿。3.了解竞争对手的情况。4.了解国家相关政策,法律法规。5.对相关行业要有所了解。
二、发帖式
这种推广方式主要针对的是个大门户网站的贴吧,论坛,博客等,主要有百度贴吧,天涯论坛,猫扑论坛,新浪博客等。BBS宣传,虽然花费精力,但是效果非常好。BBS宣传要选择自己潜在客户所在BBS,或者人气比较好BBS。
对于百度贴吧,冯先生建议少发帖子,如果发帖子过多,即使发帖子,最好不要带网址。发多了你的网站就有可能被百度惩罚,严重时可能被百度处理。不要发垃圾帖,广告帖,这种帖子很危险,很容易被删除掉。
三、sns社区式
前提还是你要注册大量的账号,关于社区推广主要以以下几个网站为主要阵地有开心网,校内网,海内网,QQ校友等。在开心网、校内、海内我们前期主要就是加好友,加到200个好友/账号。这样有利于以后的推广。
四、分类网站
也是要账号注册的,对于分类网站,主要是发对类别,否则,会被网站管理员所删除掉。这个就不用太多的注册账号了。只要发几个能吸引人注意的就可以。
五、博客式
注册各大站点的博客各一个,博客名:由你的网站名和网址组成。明确了你的关键字,添加精彩文章附上插入你网站的超链接模块。更新的勤快点,点击量大了,搜索自然也收录的多了,在搜索引擎的权重就会慢慢提高。你的网站排名自然也会随之上来。和第四点差不多,但这里的群发不是指用软件进行群发活动。而是人为的群发。比如新浪社区,需要多加圈子,然后在你博客上面写一些能吸引人的题目。这样你所加我圈子中的人都能看到你发表的文章。让你的朋友,老乡,同事等设你的网站为首页,让他们的博客插入你网站的超链接,让他们向他们的圈子宣传你的网站。
六、群发式
这里,主要讲QQ,前提还是要多加群,将每个QQ号码加到数量极限,然后在以后推广的时候进行人工群发。但还是要注意,不要发垃圾帖,可以发一些引诱性的内容。诱导群里的人去点击你的链接。然后还可以通过QQ群邮件形式进行网站推广。
七、发软文
如果你写的软文是一流的,那效果当然也是一流的了。标明文章的出处或者插入你网站的超链接,增加网站反向链接。对搜索引擎效果最佳。还能提高大家对你网站的关注度。
SNS
Facebook克隆SNS网站陷入了一场空前惨烈的厮杀当中,每个人都生怕错过互联网下一个the big
thing的机会,一波接一波的抄袭、炒做和竞争令人应接不暇、眼花缭乱。我也未能免俗,从2006年就一直关注SNS网站的发展,在2007年下半年就开始用Facebook,也一直在不断思索:究竟SNS网站的未来是什么呢?这场空前混乱的SNS大战会有什么样的结果呢?在中国,一个成功的SNS模式应该是什么样的呢?
1、小富即安、目光短浅的校内网
在校内开放API之前,我看错了两件事情:一个是低估了国内web2.0小网站开发app的热情;一个是高估了国内SNS网站商业眼光。
校内网在国内能够成功,我觉得机遇是主要的原因:王兴搞校内网的时候,国家教委开始管制各大高校的BBS,在校学生们无处可去,校内网刚好补上,而那些离校的学生面对ChinaRen和5460两个烂得不能再烂的同学录,也只能选择校内网。因此校内网的成功与其说是真人网络和定位大学生市场的成功,还不如说是国家教委和清华师兄张朝阳赐了王兴这个机会。而王兴离开校内创办海内至今没有起色,也很说明了这个问题,校内的成功不是网站模式的拷贝成功,而是机遇的成功。
BTW:我个人觉得互联网创业当中的机遇是很重要的,王志东离开新浪以后至今没有翻身已经很说明问题了。互联网成功的创业人士离开原来公司独自创业失败的例子我手里还有两个,因为认识就不方便点名了。总之,成功的人不要觉得自己很了不起,你的成功多半是走了狗屎运。我到很佩服马化腾和丁磊,从不讳言自己是走了狗屎运的。
校内网本质不是Facebook模式,而是社区网站,虽然他也做了必要的隔离,但是总体而已,UGC在校内还是占了很重要的部分,特别是校内和
mop整合的很紧密。我看过王兴创办海内的一个采访:记者问他为什么创办海内,他说校内网虽然抄袭Facebook,但是本质上还是抄袭MySpace的,而他更看好Facebook,所以创办海内,真正抄袭Facebook。这段话我当时不理解,但是后来我明白了,你仔细研究校内网,他的确是一个披了
Facebook皮的MySpace网站,他的社区性质很明显。
校内的社区性质决定了他绝不会走Facebook的商业模式,为什么呢?如果你像我一样自己辛辛苦苦创办了一个社区网站,积累了这么多会员出来,那么你绝对没有开放网站、开放用户的决心。因为这样一个社区已经可以让你真金白银的赚很多钱了,如果你现在彻彻底底的转型搞应用平台,等于是放弃了现在可以触手可及的利益,而去博一个更伟大的赌注。或者用武侠小说的典故来形容就是,你想修炼吸星大法绝世神功的话,就必须先把自己辛苦练了二十年的内功废掉,你说除非逼到绝路,谁会愿意冒这个险?
校内的两难困境就在这里,不过对于陈一舟来说,他一点不为难,因为他是一个连眼前利益都不肯放弃的人。所以校内的霸王条款一点都不奇怪,奇怪的只是把别人当傻瓜这究竟是自己的智商问题,还是别人的智商问题呢?
不过坦白说,校内现在的条件很好,积累了足够多的用户,又融了4.5亿美元的资金,完全有资格去做平台,而不必担心什么风险,更何况国内
web2.0小网站空前高涨的app开发热情和淘宝网的经验也证明了Facebook的商业战略在中国完全有实现的可能性。但是以陈一舟的性格和现在校内网的做法,我可以断定校内会亲自切入若干垂直领域,例如电子商务,旅游,网络招聘,web网游,在赚那么丁点小钱的同时,放弃了成为真正的中国Facebook的可能性。我想,如果把陈一舟换成了马云,马云一定会选择走平台的道路,所以说性格决定命运呀。
2、命运难测的开心网
前面说了开心网是真正气质上符合Facebook克隆的网站,实际上开心网成功的唯一秘诀就是抄袭Facebook抄的最谦虚,最真诚,抄到了位。开心网最火的买卖朋友和争车位这两个应用都是抄袭自Facebook的“Friends
for sale”和“Parking
War”,号称开心网贴心的注册后提示邮箱登录链接,其实也是原封不动的抄了Facebook。而开心网不过是忠实的抄袭了Facebook就已经惊人的成功了,由此可见国内互联网的作弊家们,给点专业精神好不好,你抄也得抄像点嘛。
开心网唯一的问题就是商业模式,CPC广告在国内更加行不通,如果说Facebook还能用CPC赚到1.45亿的话,那么开心压根就不用指望广告费。如果走Facebook的平台战略,构建一个巨大的应用平台,通过app商家来收费的话,这条路太长了,需要的投资太大。马云的成功毕竟也有孙正义和
Yahoo累计十多亿美元的砸钱。孙正义已经给陈一舟砸了4.5亿了,不可能再给开心网了。
所以我猜测开心网的商业模式会走第三条路,就是自己做web小游戏,最终转型成为一个SNS型的休闲web网络游戏网站。但是这条路会走的很累:一是web网游市场竞争的激烈程度完全不低于SNS网站;二是纯做小游戏的开发成本很高。
目前开心网的小游戏都是自己开发的,但是这种小游戏是有一个新鲜期的,用户一开始玩活跃度很高,但是过了新鲜期,就逐渐觉得没有意思了,用户经过了一段时间的活跃期,就会逐渐消沉下去,开心网现在已经开始出现这种问题了。所以传统网游的生命周期即便不断更新也不过3-5年而已,这种web小游戏的生命周期就更短了,不过1-3个月而已。你要保持网站用户的活跃度,就要不停的开发下去,因此开发成本会越来越高。
Facebook最聪明的地方就是他自己不开发app,只鼓励app开发商去开发,因此Facebook没有这个开发成本的巨大负担。开心网要想摆脱这个困境,还是必须走Facebook平台战略,可以说开心不走平台战略就没有大的前途,但是开心要走平台战略,这个目标就太大,实现难度过高。所以
Facebook的模式不是那么容易抄的,你真想做Facebook的话,你不开放平台是根本玩不下去的,但你开放平台你没有足够的资金支撑,你也玩不下去。
3、失败的海内网
王兴现在的处境很尴尬。王兴创办海内网的时候,已经意识到要避免成为一个社区网站了,但是由于他一开始没有从app切入,导致了海内以他不期望的方式成为了一个IT同人社区了。但是他又非常不愿意接受这一点,极力摆脱。不过他不做IT同人社区,有的是人做,于是5GSNS出来了,海内上面的大批IT大牛都跑了。不知道现在王兴究竟是高兴多一点,还是失落多一点呢。
海内网和下面要提到的所有SNS克隆网站相比,有一个本质不同:海内不提供网站公共信息的广播,你看不到朋友之外的信息,他还是以Facebook那种模式,引导你去和自己熟人去社交。但不幸的是海内的用户们毕竟是在中国BBS泡大的一代,你不用app去勾引他们,他们在海内只想着卧底发文搞UGC,而不是拉自己的哥们上来虚情假意的社交。失败,这真的是很失败呀。
4、画虎类犬的UCHome、一起、蚂蚁、5GSNS等等
这些网站都是披了Facebook外衣的MySpace克隆产品,加上海内这个本来想克隆Facebook但是无奈的成为MySpace克隆的产品。对于这些网站来说,他们本质上并不是Facebook社交工具,他们本质上是web2.0社区。这些web2.0社区如果老老实实走克隆MySpace的路也许还有点前途,但是非要披着Facebook的皮去克隆MySpace,基本只有死路一条。
别看现在UCHome搞了那么多功能,那么多插件,还开放了平台出来,但是他还是一个社区软件,不是社交工具。开心网出来已经3个月了,这些网站也很迅速的把开心网的热门app应用抄过来了,但是他们的流量有起色吗?和开心的距离拉近了吗?
为什么这几个网站抄了开心网的必杀app应用,流量仍然没有起色呢?这是因为他们做的是社区网站陌生人交往,不是社交工具熟人交往。必杀app应用只有在熟人之间才能用起来,你和陌生人之间买来买去的,谁会答理你?可悲呀,抄都抄不对。
所以我的结论就是:无论你是用Facebook之皮做社区网站也罢,还是照抄Facebook的必杀app也罢,并不真正能够达到类似开心网这种病毒式传销和流量爆增的效果。其原因就在于你就是做陌生人社区网站,而不是做熟人社交工具,所以这些app对你的网站用户扩展无效。因此UCHome花团锦簇的推出那么多功能一点都不可怕,这些东西根本就不对路。
5、新思路的楼伯伯网(loubobo.com)
楼伯伯网是上海新出现的一个地域性sns,地域到什么程度呢?就像其名字一样,地域到每一栋写字楼。这是一个标准的披着sns皮做bbs的网站,我个人很看好其模式,单独拿出来说一下。
传统的BBS要盈利,已经有两条被证明过康庄大道:
1、BBS转型做网络媒体,以BBS为基础成为网络媒体的成功案例简直多得数不过来:
新浪网的前身就是一个四通利方体育沙龙BBS;
网易的前身也是一个大BBS,我在98年还注册过账号灌水;
IT媒体类的网站,最近被收购的IT168,PCPOP哪个不是靠BBS起家的?太平洋电脑网也是BBS起家;
CSDN也是BBS起家,一开始是程序员大本营光盘的技术支持论坛;
被IT168买过去的ITPUB,ChinaUnix也是BBS;
JavaEye也是BBS起家;
2、BBS转型做电子商务
阿里巴巴网站一开始就是一个BBS,是马云亲自敲定要做BBS的;
篱笆网也是BBS,不用说了;
搜房网也是BBS起家
BBS起家的互联网网站太多了,这本来就是一条光明的大道。为什么这些互联网资深人士畏之如虎呢?
1BBS的运营难度和成本都比较高
要运营好一个BBS,站长需要非常高超的平衡能力,以及一个得力的运营团队,能把一个BBS运营好是极难的事情,这里面的门槛非常高,太多人想回避这个难度走捷径,造假,灌水,吵做,流量是上来了,社区的商业价值没有了。而且BBS需要持续不断的投入,一旦运营投入不足,BBS的人气就难以为继。
2、越是互联网资深人士越希望用网站独特的功能取胜,不战而屈人之兵,越想避免商业上的短兵相接和踏实的运营。
对互联网特别有感觉的人,往往希望用自己的长处作为核心竞争力,希望用卓越的网站功能和体验去吸引用户,战胜对手,而不屑于没有技术含量的日常运营工作和类似传统销售的营销方式。我感觉自己身上就存在这样的毛病,而且我也从上述很多人的言论当中感受到了这一点。网站毕竟是公司,要遵守商业规则,踏踏实实的运营和赚钱比整天想着用杀手锏网站功能去击败对手更重要。
而且我也强烈的感觉到一点:走捷径成功的网站往往商业模式会难产,一点一点打拼上来的网站商业模式都是顺理成章的。上面提到这么多从BBS起家的网站哪个不是踏踏实实运营了五六年以后成功的?而2005年风光无限的博客网站现在纷纷倒闭,博客网站的运营难度太小,根本无法和BBS相比,因此无法像BBS那样容易催生商业模式。
对于楼伯伯网来说,其楼的地域性使得sns不利于信息传播和传统bbs如何升级以及运营成本等几方面问题得到了很自然的解决。由于办公楼宇的相对集中,使得资讯的利用度看似分散,但是采集相对简单,而且可重复利用度相当高。例如一个名品店资讯,可以投放到周围很大一个区域。而封闭楼宇产生的归属感与排他感也非常适合sns的病毒式传播。一个封闭楼宇内社区有sns能玩的,有bbs能看的,有类似大众点评等生活资讯能口水仗的,有博客能显摆的,非常自然,一点都不觉得臃肿,因为自己楼里的社区嘛,自然希望什么设施都有最好,就像现在买房都要看社区内的设施多不多。楼伯伯用sns将楼宇内更可能相互认识的陌生人变成熟人,再用bbs将其粘住,思路非常好。而楼伯伯网本身其界面也很友好,除了楼宇的主页的感觉稍差以外,别的都很自然和老道。
从运营角度来说,楼伯伯有着其得天独厚的优势,就是有能力做广告的店铺很少,而且地域集中,需求也非常集中:就是周围几栋写字楼。地域集中导致竞争而产生广告需求,在写字楼周边的店铺本身也具有一定的档次和规模,仅投放几栋楼所需要的少量广告费用也是完全能够承担的。所以楼伯伯仅仅需要做的事情就是几栋连在一起的楼宇一起做,做火了再转移到下面几栋。楼宇火了,销售人员找到店铺管理者仅需要让他们问问周边楼内的人上不上楼伯伯网站就足够拿到广告费用了。
以上还仅仅是小头广告,增加活跃的店铺用户来热捧楼内bbs作用大于收取的广告费的费用,有了活跃店铺的参与,一个小的封闭性的有长期资讯性的社区便基本成型了,楼伯伯便可以转移到下面几栋楼宇或者下一个商圈继续推广,最后点形成片。从运营难度来说,思路非常清晰也非常低。关键看楼伯伯如何使用其地面营销部队了和细节处理了。
对于大头广告,我想知道分众传媒历史的人都不会有什么疑问了,楼伯伯楼内页面大大的“楼博传媒”已经说明其野心了。进入写字楼宇,拥有sns粘性外加地域生活资讯的可怕的广告能力是非常恐怖的。况且如果按楼投放广告费用会更加低。
总之从社区形态来说,目前国内互联网的社区有大致这样一些类型:
1、BBS为基础的,例如天涯、猫扑、西祠、搜房、篱笆等等,这些活的都很好。
2、 Blog为基础的,例如博客网,blogbus等,这些都要转型做SNS了,或者所谓的blogsphere了。
3、从SNS切入,融合Blog形态的,例如5GSNS(UCHome)、蚂蚁等等。
4、想做网络虚拟城市的SNS,例如豆瓣,一起等等。
5、其他各种类型杂交的,很多。
每个做社区的网站都在尝试解决BBS和Blog的弊病,都在尝试新的社区模式:
1、BBS是以话题为中心组织的,不利于个人的信息组织;
2、Blog是以个人为中心组织的,不利于信息的流动和分享;
3、第一代SNS是以兴趣小组为中心组织的,不利于个人信息组织,也不利于个人信息流动;
4、第二代SNS是以关系为中心组织的,能解决所有的问题吗?
5、第三代SNS是以关系为皮组织bbs资讯,是国内sns未来吗?
Matlab概率统计工具箱(3)
4.8.1 已知,单个正态总体的均值μ的假设检验(U检验法)
函数 ztest
格式 h = ztest(x,m,sigma) %
x为正态总体的样本,m为均值μ0,sigma为标准差,显著性水平为0.05(默认值)
h = ztest(x,m,sigma,alpha) %显著性水平为alpha
[h,sig,ci,zval] = ztest(x,m,sigma,alpha,tail)
%sig为观察值的概率,当sig为小概率时则对原假设提出质疑,ci为真正均值μ的1-alpha置信区间,zval为统计量的值.
说明 若h=0,表示在显著性水平alpha下,不能拒绝原假设;
若h=1,表示在显著性水平alpha下,可以拒绝原假设.
原假设:,
若tail=0,表示备择假设:(默认,双边检验);
tail=1,表示备择假设:(单边检验);
tail=-1,表示备择假设:(单边检验).
某车间用一台包装机包装葡萄糖,包得的袋装糖重是一个随机变量,它服从正态分布.当机器正常时,其均值为0.5公斤,标准差为0.015.某日开工后检验包装机是否正常,随机地抽取所包装的糖9袋,称得净重为(公斤)
0.497, 0.506, 0.518, 0.524, 0.498, 0.511, 0.52, 0.515, 0.512
问机器是否正常
解:总体μ和σ已知,该问题是当为已知时,在水平下,根据样本值判断μ=0.5还是.为此提出假设:
原假设:
备择假设:
>>
X=[0.497,0.506,0.518,0.524,0.498,0.511,0.52,0.515,0.512];
>>
[h,sig,ci,zval]=ztest(X,0.5,0.015,0.05,0)
结果显示为
h =
1
sig =
0.0248 %样本观察值的概率
ci =
0.5014 0.5210 %置信区间,均值0.5在此区间之外
zval =
2.2444 %统计量的值
结果表明:h=1,说明在水平下,可拒绝原假设,即认为包装机工作不正常.
函数 ttest
格式 h = ttest(x,m) %
x为正态总体的样本,m为均值μ0,显著性水平为0.05
h = ttest(x,m,alpha) %alpha为给定显著性水平
[h,sig,ci] = ttest(x,m,alpha,tail)
%sig为观察值的概率,当sig为小概率时则对原假设提出质疑,ci为真正均值μ的1-alpha置信区间.
说明 若h=0,表示在显著性水平alpha下,不能拒绝原假设;
若h=1,表示在显著性水平alpha下,可以拒绝原假设.
原假设:,
若 tail=0,表示备择假设:(默认,双边检验);
tail=1,表示备择假设:(单边检验);
tail=-1,表示备择假设:(单边检验).
159 280 101 212 224 379 179 264 222 362 168 250
149 260 485 170
问是否有理由认为元件的平均寿命大于225(小时)
解:未知,在水平下检验假设::,:
>> X=[159 280 101 212 224 379 179 264
222 362 168 250 149 260 485 170];
>>
[h,sig,ci]=ttest(X,225,0.05,1)
结果显示为:
h =
0
sig =
0.2570
ci =
198.2321 Inf %均值225在该置信区间内
结果表明:H=0表示在水平下应该接受原假设,即认为元件的平均寿命不大于225小时.
两个正态总体方差未知但等方差时,比较两正态总体样本均值的假设检验
函数 ttest2
格式 [h,sig,ci]=ttest2(X,Y) %X,Y为两个正态总体的样本,显著性水平为0.05
[h,sig,ci]=ttest2(X,Y,alpha) %alpha为显著性水平
[h,sig,ci]=ttest2(X,Y,alpha,tail)
%sig为当原假设为真时得到观察值的概率,当sig为小概率时则对原假设提出质疑,ci为真正均值μ的1-alpha置信区间.
说明 若h=0,表示在显著性水平alpha下,不能拒绝原假设;
若h=1,表示在显著性水平alpha下,可以拒绝原假设.
原假设:, (为X为期望值,为Y的期望值)
若 tail=0,表示备择假设:(默认,双边检验);
tail=1,表示备择假设:(单边检验);
tail=-1,表示备择假设:(单边检验).
在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的产率,试验是在同一只平炉上进行的.每炼一炉钢时除操作方法外,其他条件都尽可能做到相同.先用标准方法炼一炉,然后用建议的新方法炼一炉,以后交替进行,各炼10炉,其产率分别为
(1)标准方法:78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5
76.7 77.3
(2)新方法: 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3
80.2 82.1
设这两个样本相互独立,且分别来自正态总体和,,,均未知.问建议的新操作方法能否提高产率 (取α=0.05)
解:两个总体方差不变时,在水平下检验假设::,:
>> X=[78.1 72.4 76.2 74.3 77.4 78.4
76.0 75.5 76.7 77.3];
>>Y=[79.1 81.0 77.3 79.1 80.0 79.1
79.1 77.3 80.2 82.1];
>>
[h,sig,ci]=ttest2(X,Y,0.05,-1)
结果显示为:
h =
1
sig =
2.1759e-004 %说明两个总体均值相等的概率很小
ci =
-Inf -1.9083
结果表明:H=1表示在水平下,应该拒绝原假设,即认为建议的新操作方法提高了产率,因此,比原方法好.
函数 ranksum
格式 p = ranksum(x,y,alpha)
%x,y为两个总体的样本,可以不等长,alpha为显著性水平
[p,h] = ranksum(x,y,alpha) %
h为检验结果,h=0表示X与Y的总体差别不显著h=1表示X与Y的总体差别显著
[p,h,stats] = ranksum(x,y,alpha)
%stats中包括:ranksum为秩和统计量的值以及zval为过去计算p的正态统计量的值
说明 P为两个总体样本X和Y为一致的显著性概率,若P接近于0,则不一致较明显.
某商店为了确定向公司A或公司B购买某种商品,将A和B公司以往的各次进货的次品率进行比较,数据如下所示,设两样本独立.问两公司的商品的质量有无显著差异.设两公司的商品的次品的密度最多只差一个平移,取α=0.05.
A:7.0 3.5 9.6 8.1 6.2 5.1 10.4 4.0 2.0 10.5
B:5.7 3.2 4.1 11.0 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5
12.3
解:设,分别为A,B两个公司的商品次品率总体的均值.则该问题为在水平α=0.05下检验假设::,:
>> A=[7.0 3.5 9.6 8.1 6.2 5.1 10.4
4.0 2.0 10.5];
>> B=[5.7 3.2 4.1 11.0 9.7 6.9 3.6
4.8 5.6 8.4 10.1 5.5 12.3];
>>
[p,h,stats]=ranksum(A,B,0.05)
结果为:
p =
0.8041
h =
0
stats =
zval: -0.2481
ranksum: 116
结果表明:一方面,两样本总体均值相等的概率为0.8041,不接近于0;另一方面,H=0也说明可以接受原假设,即认为两个公司的商品的质量无明显差异.
函数 signrank
格式 p = signrank(X,Y,alpha) %
X,Y为两个总体的样本,长度必须相同,alpha为显著性水平,P两个样本X和Y的中位数相等的概率,p接近于0则可对原假设质疑.
[p,h] = signrank(X,Y,alpha) %
h为检验结果:h=0表示X与Y的中位数之差不显著,h=1表示X与Y的中位数之差显著.
[p,h,stats] = signrank(x,y,alpha) %
stats中包括:signrank为符号秩统计量的值以及zval为过去计算p的正态统计量的值.
>> x=normrnd(0,1,20,1);
>> y=normrnd(0,2,20,1);
>>
[p,h,stats]=signrank(x,y,0.05)
p =
0.3703
h =
0
stats =
zval: -0.8960
signedrank: 81
结果表明:h=0表示X与Y的中位数之差不显著
函数 signtest
格式 p=signtest(X, Y, alpha) %
X,Y为两个总体的样本,长度必须相同,alpha为显著性水平,P两个样本X和Y的中位数相等的概率,p接近于0则可对原假设质疑.
[p, h]=signtest(X, Y, alpha) %
h为检验结果:h=0表示X与Y的中位数之差不显著,h=1表示X与Y的中位数之差显著.
[p,h,stats] = signtest(X,Y,alpha) % stats中sign为符号统计量的值
>> X=normrnd(0,1,20,1);
>> Y=normrnd(0,2,20,1);
>>
[p,h,stats]=signtest(X,Y,0.05)
p =
0.2632
h =
0
stats =
sign: 7
结果表明:h=0表示X与Y的中位数之差不显著
函数 jbtest
格式 H = jbtest(X) %对输入向量X进行Jarque-Bera测试,显著性水平为0.05.
H = jbtest(X,alpha) %在水平alpha而非5%下施行 Jarque-Bera
测试,alpha在0和1之间.
[H,P,JBSTAT,CV] = jbtest(X,alpha)
%P为接受假设的概率值,P越接近于0,则可以拒绝是正态分布的原假设;JBSTAT为测试统计量的值,CV为是否拒绝原假设的临界值.
说明
H为测试结果,若H=0,则可以认为X是服从正态分布的;若X=1,则可以否定X服从正态分布.X为大样本,对于小样本用lillietest函数.
>> load carsmall
>> [h,p,j,cv]=jbtest(Weight)
h =
1
p =
0.0267
j =
7.2448
cv =
5.9915
说明 p=2.67%表示应该拒绝服从正态分布的假设;h=1也可否定服从正态分布;统计量的值j = 7.2448大于接受假设的临界值cv
=5.9915,因而拒绝假设(测试水平为5%).
函数 lillietest
格式 H = lillietest(X) %对输入向量X进行Lilliefors测试,显著性水平为0.05.
H = lillietest(X,alpha)
%在水平alpha而非5%下施行Lilliefors测试,alpha在0.01和0.2之间.
[H,P,LSTAT,CV] = lillietest(X,alpha)
%P为接受假设的概率值,P越接近于0,则可以拒绝是正态分布的原假设;LSTAT为测试统计量的值,CV为是否拒绝原假设的临界值.
说明 H为测试结果,若H=0,则可以认为X是服从正态分布的;若X=1,则可以否定X服从正态分布.
>> Y=chi2rnd(10,100,1);
>> [h,p,l,cv]=lillietest(Y)
h =
1
p =
0.0175
l =
0.1062
cv =
0.0886
说明 h=1表示拒绝正态分布的假设;p = 0.0175表示服从正态分布的概率很小;统计量的值l =
0.1062大于接受假设的临界值cv =0.0886,因而拒绝假设(测试水平为5%).
>>hist(Y)
从图中看出,数据Y不服从正态分布.
测试
函数 kstest
格式 H = kstest(X) %测试向量X是否服从标准正态分布,测试水平为5%.
H = kstest(X,cdf) %指定累积分布函数为cdf的测试(cdf=[ ]时表示标准正态分布),测试水平为5%
H = kstest(X,cdf,alpha) % alpha为指定测试水平
[H,P,KSSTAT,CV] = kstest(X,cdf,alpha)
%P为原假设成立的概率,KSSTAT为测试统计量的值,CV为是否接受假设的临界值.
说明 原假设为X服从标准正态分布.若H=0则不能拒绝原假设,H=1则可以拒绝原假设.
>> x=weibrnd(1,2,100,1);
>> [H,p,ksstat,cv]=kstest(x,[x
weibcdf(x,1,2)],0.05) %测试是否服从威布尔分布
H =
0
p =
0.3022
ksstat =
0.0959
cv =
0.1340
说明 H=0表示接受原假设,统计量ksstat小于临界值表示接受原假设.
>> [H,p,ksstat,cv]=kstest(x,[x
expcdf(x,1)],0.05) %测试是否服从指数分布
H =
1
p =
0.0073
ksstat =
0.1653
cv =
0.1340
说明 H=1表明拒绝服从指数分布的假设.
>> [H,p,ksstat,cv]=kstest(x,[ ],0.05)
%测试是否服从标准正态分布
H =
1
p =
3.1285e-026
ksstat =
0.5380
cv =
0.1340
说明 H=1表明不服从标准正态分布.
函数 kstest2
格式 H = kstest2(X1,X2)
%测试向量X1与X2是具有相同的连续分布,测试水平为5%.
H = kstest2(X1,X2,alpha) % alpha为测试水平
[H,P,KSSTAT] = kstest(X,cdf,alpha)
%与指定累积分布cdf相同的连续分布,P为假设成立的概率,KSSTAT为测试统计量的值.
说明原假设为具有相同连续分布.测试结果为H,若H=0,表示应接受原假设;若H=1,表示可以拒绝原假设.这是Kolmogorov-Smirnov测试方法.
>>
x=-1:1:5;
>> y=randn(20,1);
>> [h,p,k]=kstest2(x,y)
h =
1
p =
0.0444
k =
0.5643
说明 h=1表示可以认为向量x与y的分布不相同,相同的概率只有4.4%.
4.9.1 单因素方差分析
单因素方差分析是比较两组或多组数据的均值,它返回原假设——均值相等的概率
函数 anova1
格式 p = anova1(X) %X的各列为彼此独立的样本观察值,其元素个数相同,p为各列均值相等的概率值,若p值接近于0,则原假设受到怀疑,说明至少有一列均值与其余列均值有明显不同.
p = anova1(X,group) %X和group为向量且group要与X对应
p = anova1(X,group,’displayopt’) %
displayopt=on/off表示显示与隐藏方差分析表图和盒图
[p,table] = anova1(…) % table为方差分析表
[p,table,stats] = anova1(…) % stats为分析结果的构造
说明 anova1函数产生两个图:标准的方差分析表图和盒图.
方差分析表中有6列:第1列(source)显示:X中数据可变性的来源;第2列(SS)显示:用于每一列的平方和;第3列(df)显示:与每一种可变性来源有关的自由度;第4列(MS)显示:是SS/df的比值;第5列(F)显示:F统计量数值,它是MS的比率;第6列显示:从F累积分布中得到的概率,
当F增加时,p值减少.
设有3台机器,用来生产规格相同的铝合金薄板.取样测量薄板的厚度,精确至‰厘米.得结果如下:
机器1:0.236 0.238 0.248 0.245 0.243
机器2:0.257 0.253 0.255 0.254 0.261
机器3:0.258 0.264 0.259 0.267 0.262
检验各台机器所生产的薄板的厚度有无显著的差异
解:
>> X=[0.236 0.238 0.248 0.245 0.243;
0.257 0.253 0.255 0.254 0.261;…
0.258 0.264 0.259 0.267 0.262];
>> P=anova1(X’)
结果为:
P =
1.3431e-005
建筑横梁强度的研究:3000磅力量作用在一英寸的横梁上来测量横梁的挠度,钢筋横梁的测试强度是:82
86 79 83 84 85 86 87;其余两种更贵的合金横梁强度测试为合金1:74 82 78
75 76 77;合金2:79 79 77 78 82 79].
检验这些合金强度有无明显差异
解:
>> strength = [82 86 79 83 84 85 86
87 74 82 78 75 76 77 79 79 77 78 82 79];
>>alloy =
{’st’,’st’,’st’,’st’,’st’,’st’,’st’,’st’,
‘al1′,’al1′,’al1′,’al1′,’al1′,’al1′,…
‘al2′,’al2′,’al2′,’al2′,’al2′,’al2′};
>> [p,table,stats] =
anova1(strength,alloy,’on’)
结果为
p =
1.5264e-004
table =
‘Source’ ‘SS’ ‘df’ ‘MS’ ‘F’ ‘Prob>F’
‘Groups’ [184.8000] [ 2] [92.4000] [15.4000] [1.5264e-004]
‘Error’ [102.0000] [17] [ 6.0000] [ ] [ ]
‘Total’ [286.8000] [19] [ ] [ ] [ ]
stats =
gnames: {3×1
cell}
n: [8 6 6]
source: ‘anova1′
means: [84 77 79]
df: 17
s: 2.4495
函数 anova2
格式 p = anova2(X,reps)
p = anova2(X,reps,’displayopt’)
[p,table] = anova2(…)
[p,table,stats] = anova2(…)
说明执行平衡的双因素试验的方差分析来比较X中两个或多个列(行)的均值,不同列的数据表示因素A的差异,不同行的数据表示另一因素B的差异.如果行列对有多于一个的观察点,则变量reps指出每一单元观察点的数目,每一单元包含reps行,如:
reps=2
其余参数与单因素方差分析参数相似.
一火箭使用了4种燃料,3种推进器作射程试验,每种燃料与每种推进器的组合各发射火箭2次,得到结果如下:
推进器(B) B1 B2 B3
A1 58.2000 56.2000 65.3000
52.6000 41.2000 60.8000
A2 49.1000 54.1000 51.6000
燃料A 42.8000 50.5000 48.4000
A3 60.1000 70.9000 39.2000
58.3000 73.2000 40.7000
A4 75.8000 58.2000 48.7000
71.5000 51.0000 41.4000
考察推进器和燃料这两个因素对射程是否有显著的影响
解:建立M文件
X=[58.2000 56.2000 65.3000
52.6000 41.2000 60.8000
49.1000 54.1000 51.6000
42.8000 50.5000 48.4000
60.1000 70.9000 39.2000
58.3000 73.2000 40.7000
75.8000 58.2000 48.7000
71.5000 51.0000 41.4000];
P=anova2(X,2)
结果为:
P =
0.0035 0.0260 0.0001
显示方差分析图为图4-26.
Matlab概率统计工具箱(2)
命令 求样本方差
函数 var
格式 D=var(X) %var(X)=,若X为向量,则返回向量的样本方差.
D=var(A) %A为矩阵,则D为A的列向量的样本方差构成的行向量.
D=var(X, 1) %返回向量(矩阵)X的简单方差(即置前因子为的方差)
D=var(X, w) %返回向量(矩阵)X的以w为权重的方差
函数 std
格式 std(X)
%返回向量(矩阵)X的样本标准差(置前因子为)即:
std(X,1) %返回向量(矩阵)X的标准差(置前因子为)
std(X, 0) %与std (X)相同
std(X, flag, dim)
%返回向量(矩阵)中维数为dim的标准差值,其中flag=0时,置前因子为;否则置前因子为.
函数 nanstd
格式 y = nanstd(X)
%若X为含有元素NaN的向量,则返回除NaN外的元素的标准差,若X为含元素NaN的矩阵,则返回各列除NaN外的标准差构成的向量.
函数 skewness
格式 y = skewness(X) %X为向量,返回X的元素的偏斜度;X为矩阵,返回X各列元素的偏斜度构成的行向量.
y = skewness(X,flag) %flag=0表示偏斜纠正,flag=1(默认)表示偏斜不纠正.
说明偏斜度样本数据关于均值不对称的一个测度,如果偏斜度为负,说明均值左边的数据比均值右边的数据更散;如果偏斜度为正,说明均值右边的数据比均值左边的数据更散,因而正态分布的偏斜度为
0;偏斜度是这样定义的:
其中:μ为x的均值,σ为x的标准差,E(.)为期望值算子
命令 均匀分布(连续)的期望和方差
函数 unifstat
格式 [M,V] = unifstat(A,B)
%A,B为标量时,就是区间上均匀分布的期望和方差,A,B也可为向量或矩阵,则M,V也是向量或矩阵.
函数 normstat
格式 [M,V] = normstat(MU,SIGMA)
%MU,SIGMA可为标量也可为向量或矩阵,则M=MU,V=SIGMA2.
函数 binostat
格式 [M,V] = binostat(N,P) %N,P为二项分布的两个参数,可为标量也可为向量或矩阵.
命令 协方差
函数 cov
格式 cov(X) %求向量X的协方差
cov(A)
%求矩阵A的协方差矩阵,该协方差矩阵的对角线元素是A的各列的方差,即:var(A)=diag(cov(A)).
cov(X,Y) %X,Y为等长列向量,等同于cov([X Y]).
函数 corrcoef
格式 corrcoef(X,Y) %返回列向量X,Y的相关系数,等同于corrcoef([X Y]).
corrcoef (A) %返回矩阵A的列向量的相关系数矩阵
4.6.1 正整数的频率表
命令 正整数的频率表
函数 tabulate
格式 table = tabulate(X)
%X为正整数构成的向量,返回3列:第1列中包含X的值第2列为这些值的个数,第3列为这些值的频率.
函数 cdfplot
格式 cdfplot(X)
%作样本X(向量)的累积分布函数图形
h = cdfplot(X) %h表示曲线的环柄
[h,stats] = cdfplot(X) %stats表示样本的一些特征
函数 lsline
格式 lsline %最小二乘拟合直线
h = lsline %h为直线的句柄
函数 normplot
格式 normplot(X) %若X为向量,则显示正态分布概率图形,若X为矩阵,则显示每一列的正态分布概率图形.
h = normplot(X) %返回绘图直线的句柄
说明 样本数据在图中用"+"显示;如果数据来自正态分布,则图形显示为直线,而其它分布可能在图中产生弯曲.
函数 weibplot
格式 weibplot(X)
%若X为向量,则显示威布尔(Weibull)概率图形,若X为矩阵,则显示每一列的威布尔概率图形.
h = weibplot(X) %返回绘图直线的柄
说明绘制威布尔(Weibull)概率图形的目的是用图解法估计来自威布尔分布的数据X,如果X是威布尔分布数据,其图形是直线的,否则图形中可能产生弯曲.
函数 boxplot
格式 boxplot(X)
%产生矩阵X的每一列的盒图和"须"图,"须"是从盒的尾部延伸出来,并表示盒外数据长度的线,如果"须"的外面没有数据,则在"须"的底部有一个点.
boxplot(X,notch) %当notch=1时,产生一凹盒图,notch=0时产生一矩箱图.
boxplot(X,notch,’sym’) %sym表示图形符号,默认值为"+".
boxplot(X,notch,’sym’,vert)
%当vert=0时,生成水平盒图,vert=1时,生成竖直盒图(默认值vert=1).
boxplot(X,notch,’sym’,vert,whis)
%whis定义"须"图的长度,默认值为1.5,若whis=0则boxplot函数通过绘制sym符号图来显示盒外的所有数据值.
函数 refline
格式 refline(slope,intercept) % slope表示直线斜率,intercept表示截距
refline(slope) slope=[a b],图中加一条直线:y=b+ax.
函数 refcurve
格式 h = refcurve(p) %在图中加入一条多项式曲线,h为曲线的环柄,p为多项式系数向量,p=[p1,p2,
p3,…,pn],其中p1为最高幂项系数.
函数 capaplot
格式 p = capaplot(data,specs)
%data为所给样本数据,specs指定范围,p表示在指定范围内的概率.
说明 该函数返回来自于估计分布的随机变量落在指定范围内的概率
函数 histfit
格式 histfit(data) %data为向量,返回直方图
和正态曲线.
histfit(data,nbins) % nbins指定bar的个数,
缺省时为data中数据个数的平方根.
函数 normspec
格式 p = normspec(specs,mu,sigma) %specs指定界线,mu,sigma为正态分布的参数p
为样本落在上,下界之间的概率.
4.7.1 常见分布的参数估计
命令 β分布的参数a和b的最大似然估计值和置信区间
函数 betafit
格式 PHAT=betafit(X)
[PHAT,PCI]=betafit(X,ALPHA)
说明 PHAT为样本X的β分布的参数a和b的估计量
PCI为样本X的β分布参数a和b的置信区间,是一个2×2矩阵,其第1例为参数a的置信下界和上界,第2例为b的置信下界和上界,ALPHA为显著水平,(1-α)×100%为置信度.
函数 normfit
格式 [muhat,sigmahat,muci,sigmaci] = normfit(X)
[muhat,sigmahat,muci,sigmaci] = normfit(X,alpha)
说明
muhat,sigmahat分别为正态分布的参数μ和σ的估计值,muci,sigmaci分别为置信区间,其置信度为;alpha给出显著水平α,缺省时默认为0.05,即置信度为95%.
函数 mle
格式 phat=mle %返回用dist指定分布的最大似然估计值
[phat, pci]=mle %置信度为95%
[phat, pci]=mle %置信度由alpha确定
[phat, pci]=mle %仅用于二项分布,pl为试验次数.
说明
dist为分布函数名,如:beta(分布),bino(二项分布)等,X为数据样本,alpha为显著水平α,为置信度.
binofit
PHAT= binofit(X, N)
[PHAT, PCI] = binofit(X,N)
[PHAT, PCI]= binofit (X, N, ALPHA)
二项分布的概率的最大似然估计
置信度为95%的参数估计和置信区间
返回水平α的参数估计和置信区间
Lambdahat=poissfit(X)
[Lambdahat, Lambdaci] = poissfit(X)
[Lambdahat, Lambdaci]= poissfit (X, ALPHA)
泊松分布的参数的最大似然估计
置信度为95%的参数估计和置信区间
返回水平α的λ参数和置信区间
[muhat,sigmahat,muci,sigmaci] = normfit(X)
[muhat,sigmahat,muci,sigmaci] = normfit(X, ALPHA)
正态分布的最大似然估计,置信度为95%
返回水平α的期望,方差值和置信区间
PHAT =betafit (X)
[PHAT, PCI]= betafit (X, ALPHA)
返回β分布参数a和 b的最大似然估计
返回最大似然估计值和水平α的置信区间
[ahat,bhat] = unifit(X)
[ahat,bhat,ACI,BCI] = unifit(X)
[ahat,bhat,ACI,BCI]=unifit(X, ALPHA)
均匀分布参数的最大似然估计
置信度为95%的参数估计和置信区间
返回水平α的参数估计和置信区间
muhat =expfit(X)
[muhat,muci] = expfit(X)
[muhat,muci] = expfit(X,alpha)
指数分布参数的最大似然估计
置信度为95%的参数估计和置信区间
返回水平α的参数估计和置信区间
phat =gamfit(X)
[phat,pci] = gamfit(X)
[phat,pci] = gamfit(X,alpha)
γ分布参数的最大似然估计
置信度为95%的参数估计和置信区间
返回最大似然估计值和水平α的置信区间
phat = weibfit(X)
[phat,pci] = weibfit(X)
[phat,pci] = weibfit(X,alpha)
韦伯分布参数的最大似然估计
置信度为95%的参数估计和置信区间
返回水平α的参数估计及其区间估计
phat = mle(‘dist’,data)
[phat,pci] = mle(‘dist’,data)
[phat,pci] = mle(‘dist’,data,alpha)
[phat,pci] = mle(‘dist’,data,alpha,p1)
分布函数名为dist的最大似然估计
置信度为95%的参数估计和置信区间
返回水平α的最大似然估计值和置信区间
仅用于二项分布,pl为试验总次数
说明各函数返回已给数据向量X的参数最大似然估计值和置信度为(1-α)×100%的置信区间.α的默认值为0.05,即置信度为95%.
命令 高斯—牛顿法的非线性最小二乘数据拟合
函数 nlinfit
格式 beta = nlinfit(X,y,FUN,beta0)
%返回在FUN中描述的非线性函数的系数.FUN为用户提供形如的函数,该函数返回已给初始参数估计值β和自变量X的y的预测值.
[beta,r,J] = nlinfit(X,y,FUN,beta0)
%beta为拟合系数,r为残差,J为Jacobi矩阵,beta0为初始预测值.
说明 若X为矩阵,则X的每一列为自变量的取值,y是一个相应的列向量.如果FUN中使用了@,则表示函数的柄.
函数 nlparci
格式 ci = nlparci(beta,r,J)
%返回置信度为95%的置信区间,beta为非线性最小二乘法估计的参数值,r为残差,J为Jacobian矩阵.nlparci可以用nlinfit函数的输出作为其输入.
函数 nlintool
格式 nlintool(x,y,FUN,beta0)
%返回数据(x,y)的非线性曲线的预测图形,它用2条红色曲线预测全局置信区间.beta0为参数的初始预测值,置信度为95%.
nlintool(x,y,FUN,beta0,alpha) %置信度为(1-alpha)×100%
函数 nlpredci
格式 ypred = nlpredci(FUN,inputs,beta,r,J) %
ypred
为预测值,FUN与前面相同,beta为给出的适当参数,r为残差,J为Jacobian矩阵,inputs为非线性函数中的独立变量的矩阵值.
[ypred,delta] = nlpredci(FUN,inputs,beta,r,J)
%delta为非线性最小二乘法估计的置信区间长度的一半,当r长度超过beta的长度并且J的列满秩时,置信区间的计算是有效的.[ypred-delta,ypred+delta]为置信度为95%的不同步置信区间.
ypred = nlpredci(FUN,inputs,beta,r,J,alpha,’simopt’,'predopt’)
%控制置信区间的类型,置信度为100(1-alpha)%.’simopt’ = ‘on’ 或’off’
(默认值)分别表示同步或不同步置信区间.’predopt’='curve’ (默认值) 表示输入函数值的置信区间,
‘predopt’='observation’
表示新响应值的置信区间.nlpredci可以用nlinfit函数的输出作为其输入.
函数 nnls(该函数已被函数lsnonneg代替,在6.0版中使用nnls将产生警告信息)
格式 x = nnls(A,b)
%最小二乘法判断方程A×x=b的解,返回在x≥0的条件下使得最小的向量x,其中A和b必须为实矩阵或向量.
x = nnls(A,b,tol) % tol为指定的误差
[x,w] = nnls(A,b) %当x中元素时,,当时.
[x,w] = nnls(A,b,tol)
函数 lsqnonneg
格式 x = lsqnonneg(C,d) %返回在x≥0的条件下使得最小的向量x,其中C和d必须为实矩阵或向量.
x = lsqnonneg(C,d,x0) % x0为初始点,x0≥0
x = lsqnonneg(C,d,x0,options) %options为指定的优化参数,参见options函数.
[x,resnorm] = lsqnonneg(…) %resnorm表示norm(C*x-d).^2的残差
[x,resnorm,residual] = lsqnonneg(…) %residual表示C*x-d的残差
命令 负分布的对数似然函数
函数 Betalike
格式 logL=betalike(params,data) %返回负分布的对数似然函数,params为向量[a,
b],是分布的参数,data为样本数据.
[logL,info]=betalike(params,data) %返回Fisher逆信息矩阵info.如果params
中输入的参数是极大似然估计值,那么info的对角元素为相应参数的渐近方差.
说明
betalike是分布最大似然估计的实用函数.似然函数假设数据样本中,所有的元素相互独立.因为betalike返回负对数似然函数,用fmins函数最小化betalike与最大似然估计的功能是相同的.
函数 Gamlike
格式 logL=gamlike(params,data)
%返回由给定样本数据data确定的分布的参数为params(即[a,b])的负对数似然函数值
[logL,info]=gamlike(params,data)
%返回Fisher逆信息矩阵info.如果params中输入的参数是极大似然估计值,那么info的对角元素为相应参数的渐近方差.
说明
gamlike是分布的最大似然估计函数.因为gamlike返回对数似然函数值,故用fmins函数将gamlike最小化后,其结果与最大似然估计是相同的.
函数 normlike
格式 logL=normlike(params,data)
%返回由给定样本数据data确定的,负正态分布的,参数为params(即[mu,sigma])的对数似然函数值.
[logL,info]=normlike(params,data)
%返回Fisher逆信息矩阵info.如果params中输入的参数是极大似然估计值,那么info的对角元素为相应参数的渐近方差.
函数 Weiblike
格式 logL = weiblike(params,data)
%返回由给定样本数据data确定的,威布尔分布的,参数为params(即[a,b])的对数似然函数值.
[logL,info]=weiblike(params,data)
%返回Fisher逆信息矩阵info.如果params中输入的参数是极大似然估计值,那么info的对角元素为相应参数的渐近方差.
Matlab概率统计工具箱(1)
4.1 随机数的产生
4.1.1 二项分布的随机数据的产生
命令 参数为N,P的二项随机数据
函数 binornd
binornd(N,P)
%N,P为二项分布的两个参数,返回服从参数为N,P的二项分布的随机数,N,P大小相同.
R =
binornd(N,P,m)
%m指定随机数的个数,与R同维数.
R =
binornd(N,P,m,n)
%m,n分别表示R的行数和列数
命令 参数为μ,σ的正态分布的随机数据
函数 normrnd
normrnd(MU,SIGMA)
%返回均值为MU,标准差为SIGMA的正态分布的随机数据,R可以是向量或矩阵.
R =
normrnd(MU,SIGMA,m)
%m指定随机数的个数,与R同维数.
R =
normrnd(MU,SIGMA,m,n)
%m,n分别表示R的行数和列数
命令 求指定分布的随机数
函数 random
格式 y =
random(‘name’,A1,A2,A3,m,n)
%name的取值见表4-2;A1,A2,A3为分布的参数;m,n指定随机数的行和列
4.2.1 通用函数计算概率密度函数值
命令 通用函数计算概率密度函数值
函数 pdf
格式 Y=pdf(name,K,A)
Y=pdf(name,K,A,B)
Y=pdf(name,K,A,B,C)
说明返回在X=K处,参数为A,B,C的概率密度值,对于不同的分布,参数个数是不同;name为分布函数名,其取值如表4-2.
命令 二项分布的概率值
函数 binopdf
格式 binopdf (k, n, p) %等同于, p —
每次试验事件A发生的概率;K—事件A发生K次;n—试验总次数
命令 泊松分布的概率值
函数 poisspdf
格式 poisspdf(k, Lambda) %等同于
命令 正态分布的概率值
函数 normpdf(K,mu,sigma)
%计算参数为μ=mu,σ=sigma的正态分布密度函数在K处的值
专用函数计算概率密度函数列表如表4-3.
1.二项分布
例4-7
>>x = 0:10;
>>y = binopdf(x,10,0.5);
>>plot(x,y,’+')
例4-8
>> x =
0:0.2:15;
>>y = chi2pdf(x,4);
>>plot(x,y)
例4-9
>>x =
(0:0.1:10)’;
>>p1 = ncx2pdf(x,4,2);
>>p = chi2pdf(x,4);
>>plot(x,p,’–’,x,p1,’-')
例4-10
>>x =
0:0.1:10;
>>y = exppdf(x,2);
>>plot(x,y)
例4-11
>>x =
0:0.01:10;
>>y = fpdf(x,5,3);
>>plot(x,y)
例4-12
>>x =
(0.01:0.1:10.01)’;
>>p1 = ncfpdf(x,5,20,10);
>>p = fpdf(x,5,20);
>>plot(x,p,’–’,x,p1,’-')
例4-13
>>x =
gaminv((0.005:0.01:0.995),100,10);
>>y = gampdf(x,100,10);
>>y1 = normpdf(x,1000,100);
>>plot(x,y,’-',x,y1,’-.’)
例4-14
>>x =
(10:1000:125010)’;
>>y = lognpdf(x,log(20000),1.0);
>>plot(x,y)
>>set(gca,’xtick’,[0 30000 60000
90000 120000])
>>set(gca,’xticklabel’,str2mat(‘0′,’$30,000′,’$60,000′,…
‘$90,000′,’$120,000′))
例4-15
>>x = (0:10);
>>y = nbinpdf(x,3,0.5);
>>plot(x,y,’+')
例4-16
>>
x=-3:0.2:3;
>> y=normpdf(x,0,1);
>> plot(x,y)
例4-17
>>x = 0:15;
>>y = poisspdf(x,5);
>>plot(x,y,’+')
例4-18
>>x =
[0:0.01:2];
>>p = raylpdf(x,0.5);
>>plot(x,p)
例4-19
>>x =
-5:0.1:5;
>>y = tpdf(x,5);
>>z = normpdf(x,0,1);
>>plot(x,y,’-',x,z,’-.’)
例4-20
>>
t=0:0.1:3;
>> y=weibpdf(t,2,2);
>> plot(y)
4.3.1 通用函数计算累积概率值
命令 通用函数cdf用来计算随机变量的概率之和(累积概率值)
函数 cdf
格式
说明 返回以name为分布,随机变量X≤K的概率之和的累积概率值,name的取值见表4-1 常见分布函数表
命令 二项分布的累积概率值
函数 binocdf
格式 binocdf (k, n, p)
%n为试验总次数,p为每次试验事件A发生的概率,k为n次试验中事件A发生的次数,该命令返回n次试验中事件A恰好发生k次的概率.
命令 正态分布的累积概率值
函数 normcdf
格式 normcdf() %返回F(x)=的值,mu,sigma为正态分布的两个参数
MATLAB中的逆累积分布函数是已知,求x.
逆累积分布函数值的计算有两种方法
4.4.1 通用函数计算逆累积分布函数值
命令 icdf 计算逆累积分布函数
格式
说明 返回分布为name,参数为,累积概率值为P的临界值,这里name与前面表4.1相同.
如果,则
4.4.2 专用函数-inv计算逆累积分布函数
命令 正态分布逆累积分布函数
函数 norminv
格式 X=norminv(p,mu,sigma)
%p为累积概率值,mu为均值,sigma为标准差,X为临界值,满足:p=P{X≤x}.
4.5.1 平均值,中值
命令 利用mean求算术平均值
格式 mean(X) %X为向量,返回X中各元素的平均值
mean(A)
%A为矩阵,返回A中各列元素的平均值构成的向量
mean(A,dim) %在给出的维数内的平均值
说明 X为向量时,算术平均值的数学含义是,即样本均值.
格式 nanmean(X) %X为向量,返回X中除NaN外元素的算术平均值.
nanmean(A) %A为矩阵,返回A中各列除NaN外元素的算术平均值向量.
格式 median(X) %X为向量,返回X中各元素的中位数.
median(A) %A为矩阵,返回A中各列元素的中位数构成的向量.
median(A,dim) %求给出的维数内的中位数
格式 nanmedian(X) %X为向量,返回X中除NaN外元素的中位数.
nanmedian(A) %A为矩阵,返回A中各列除NaN外元素的中位数向量.
格式 M=geomean(X) %X为向量,返回X中各元素的几何平均数.
M=geomean(A) %A为矩阵,返回A中各列元素的几何平均数构成的向量.
说明 几何平均数的数学含义是,其中:样本数据非负,主要用于对数正态分布.
格式 M=harmmean(X) %X为向量,返回X中各元素的调和平均值.
M=harmmean(A) %A为矩阵,返回A中各列元素的调和平均值构成的向量.
说明 调和平均值的数学含义是,其中:样本数据非0,主要用于严重偏斜分布.
命令 排序
格式 Y=sort(X) %X为向量,返回X按由小到大排序后的向量.
Y=sort(A) %A为矩阵,返回A的各列按由小到大排序后的矩阵.
[Y,I]=sort(A) % Y为排序的结果,I中元素表示Y中对应元素在A中位置.
sort(A,dim) %在给定的维数dim内排序
说明 若X为复数,则通过|X|排序.
函数 sortrows
格式 Y=sortrows(A) %A为矩阵,返回矩阵Y,Y按A的第1列由小到大,以行方式排序后生成的矩阵.
Y=sortrows(A, col) %按指定列col由小到大进行排序
[Y,I]=sortrows(A, col) % Y为排序的结果,I表示Y中第col列元素在A中位置.
说明 若X为复数,则通过|X|的大小排序.
函数 range
格式 Y=range(X) %X为向量,返回X中的最大值与最小值之差.
Y=range(A) %A为矩阵,返回A中各列元素的最大值与最小值之差.
命令 计算样本均值
函数 mean
格式 用法与前面一样
利用sum函数计算