请选择 进入手机版 | 继续访问电脑版

中国拿破仑论坛

 找回密码
 入伍
新兵指南:让新兵更快熟悉论坛转载文章请注明作者/译者及出处@napolun.com邮箱自助申请
近卫军名将 - 赤胆忠心的“圣贤”德鲁奥 电影《滑铁卢》DVD-5一张钱老神作 THE CAMPAIGNS OF NAPOLEON
拿破仑所著小说《克利松与欧仁妮》波兰军团的创始者——东布罗夫斯基 路易斯-皮雷•蒙布伦和他的骑兵生涯
查看: 1999|回复: 5

[原创] 拿破仑战争数据统计以及一些计量分析

[复制链接]
发表于 2015-8-30 14:03:07 | 显示全部楼层 |阅读模式
本帖最后由 yiyuezhuo 于 2015-8-30 15:13 编辑

收集并整理了wiki下Napoleonic Wars类别下200多个战役的summary。主要是提取其中的量化信息,对计量实证感兴趣的可以看看。大多数战役都有其名称,背景(半岛战争这种),位置,结果,指挥官,参战双方兵力,参战双方兵力损失等。数据抓取是直接用python写爬虫爬了那些词条并用bs4提取的信息。之后我自己又把数据折腾了一下,给多数战役都明确指定了到底谁赢,抛弃了大胜小胜战略胜利战术失败之类的区别。人数等如果出现区间,就计算均值,如果出现多个战区,就加总,如果有在场和实际参战数量的差别,就取实际参战数量。这样这些数据就可以直接进行计量分析了,虽然有没有意义另说。

N1 这里只包含了1805及之后的战役
N2 这里包含海战,攻城战和陆战,注意区分。
N3 各个表中除了Exam都是从左往右加工越来越多的。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?入伍

x
回复

使用道具 举报

 楼主| 发表于 2015-8-30 14:15:55 | 显示全部楼层
不知道诸位对计量史学有何了解,我是看了这两篇论文才想起找数据弄弄但找不到才收集的。

[1]梁若冰. 气候冲击与晚清教案[J]. 经济学(季刊),2014,04:1557-1584.
[2]陈强. 气候冲击、王朝周期与游牧民族的征服[J]. 经济学(季刊),2015,01:373-394.

不过战争的数据相比他们研究的对象复杂得多,比如直接上回归的话模型不好选择,而且各个时期的兵力也不是相同的,乃至像半岛战争我是把西班牙兵力与英军兵力直接求和算联军兵力的话,虽然这样算也有相应的统计意义,但总觉得与所想研究的对象(如将领能力等)相差甚远。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2015-8-30 14:54:45 | 显示全部楼层
抛砖引玉,先作一些粗略的计量分析。完全不管什么内生性之类的问题,因为细究的话模型就肯定是不对的。

筛选出157个战役进行logistic回归,因变量为法军胜利(取0)或是联军胜利(取1)。自变量有法军兵力数,联军兵力数与拿破仑,内伊,缪拉,威灵顿是否作为主要指挥官(wiki里commander是否有他名字)作为虚拟变量。可以将54%的预测准确度升到65%,不算好,不过这只是例子。

回归的系数结果

                        方程中的变量
                B        S.E,        Wals        df        Sig.        Exp (B)
步骤 1a        StrengthF        .000        .000        2.880        1        .090        1.000
        StrengthA        .000        .000        7.202        1        .007        1.000
        Napolean        -1.937        .689        7.892        1        .005        .144
        MichelNey        -1.550        .747        4.302        1        .038        .212
        JoachimMurat        .950        .606        2.456        1        .117        2.586
        WW        2.276        .734        9.608        1        .002        9.736
        常量        -.257        .267        .923        1        .337        .774

logistic回归的系数不想线性回归那样好解释。具体含义可以去看相关资料。这里我给出一些例子来比较。以50000法军兵力对阵50000联军兵力的预测概率为标准,比较各种情况。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2015-8-30 15:07:19 | 显示全部楼层
本帖最后由 yiyuezhuo 于 2015-8-30 15:09 编辑

下面的概率可以看成联军胜率Q,或者1-Q就得到了法军胜率。(下文的P是指上面那个表的sig值,显著性水平,这个值粗略地说可以看成其对模型影响为0的概率,所以对于其存在感该值越低越好)
50000法军 VS 50000联军 46% (这说明平均法军战力比联军强)
75000法军 VS 50000联军 30%
50000法军 VS 75000联军 64%
50000法军+拿破仑 VS 50000联军 11% (拿破仑的加成是统计显著地)
50000法军+内伊 VS 50000联军 15% (P=0.038,5%水平下显著)
50000法军+缪拉 VS 50000联军 68% (缪拉实际上是提供减成。。恩,不过P=0.11不显著)
50000法军 VS 50000联军+威灵顿 89% (铁公爵的加成也是显著的)
50000法军+内伊 VS 50000联军+威灵顿 63% (威灵顿还是比内伊强,当然这个看回归系数就看出来了)

回复 支持 反对

使用道具 举报

 楼主| 发表于 2015-8-30 15:21:47 | 显示全部楼层
为什么缪拉是提供减成的呢?因为其在1815战役里多数战役都失败了,由于其成功跻身wiki主要指挥官的多数战役里怒刷战绩,所以从似然性角度来看,似乎把他看成减战力的比把他看成加战力的要更有可能。这个减与增是相对的,可能有人觉得无论如何有他总比没他好,这个某种意义上是对的,可以通过改变似然函数来实现这个效果。不过也要注意这些回归里截距和误差项提供了一个参考基线,也就是说在某些没有捕捉到的变量里(比如布吕歇尔就没有作为虚拟变量加入),缪拉与这些效应的平均水平相比,可能要更差一些。毕竟的确其作为主要指挥官的“大多数”战役都失败了,假如根据规模加权可能会好一点。可是无论如何,要是用回归的眼光来看,马谡这类的肯定是提供减成的。。因为没有他出场但胜利了的变异来扳回一城。
回复 支持 反对

使用道具 举报

发表于 2015-8-30 22:16:22 | 显示全部楼层
强悍的技术帖啊,这样也可以让威灵顿和达武隔空对战一回了
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 入伍

本版积分规则

小黑屋|手机版|Archiver|中国拿破仑 ( 京ICP备05046168号 )

GMT+8, 2019-9-23 13:00 , Processed in 0.139979 second(s), 16 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表