研究助理

了解研究论文方法的关键特性

在对 Cloud 控制台使用不同参数值时,或通过直接调用 Vertex AI API,您可以直接查询模型,并测试返回的结果。

系统指令
您是科学研究专家,拥有多年的系统文献调查和不同主题的荟萃分析经验。您以出色的准确性和对细节的关注而自豪。您始终坚持提供的信息来源中的事实,绝不杜撰新事实。

提示自由格式

现在,请查看下面的研究论文,并用 1-2 个句子回答以下问题。 1. 论文的发表时间是什么时候? 2. 样本大小是多少? 3. 研究方法是什么?尤其是,这是否是一项随机对照试验? 4. 这项研究的资金来源是什么?尤其是,资金是否来自商业资助者? 5. 研究的关键问题是什么? 6. 针对所研究的关键问题,有哪些关键发现?

研究论文:The miracle of microfinance? 随机对照试验结果∗ Abhijit Banerjee† Esther Duflo‡ Rachel Glennerster§ Cynthia Kinnan¶ 此版本:2014 年 3 月 摘要 本文报告了对印度海得拉巴德的群体贷款小额信贷计划进行的随机对照试验结果。一家放款机构在 52 个随机选定的社区开展业务,使微额信贷的使用率提高了 8.4%。现有企业的小型企业投资和利润有所增加,但消费并未显著增加。耐用品支出增加,而“诱惑性商品”支出则有所减少。我们发现,在健康、教育或妇女赋权方面没有出现明显变化。两年后,对照组获得了小额信贷,但实验组的家庭借款时间更长、金额更大,但两组之间仍然没有明显差异。JEL 代码:O16、G21、D21 ∗本文是对 2010 年版本的更新和替代版本,后者使用一轮结束时调查报告了结果。第一波调查的资金由 The Vanguard Charitable Endowment Program 和 ICICI 银行提供。第二波活动的资金由 Spandana 和 J-PAL 提供。此草稿未经 The Vanguard Charitable Endowment Program、ICICI Bank 或 Spandana 审核。印度金融管理研究学院 (IFMR) 的微型金融中心(印度钦奈)负责设置和组织实验以及数据收集,并先将匿名化数据提供给研究团队,然后再公开发布。当时,IFMR 没有 IRB。数据分析和持续数据收集已获得 MIT COUHES (1203004973) 和西北大学 (STU00063636) 的 IRB 批准。Adie Angrist、Leonardo Elias、Harris Eppsteiner、Shehla Imran、Seema Kacker、Tracy Li、Aditi Nagaraj 和 Cecilia Peluffo 提供了出色的研究协助。本文中所用这两次数据的相关数据集可在 http://www.centre-for-microfinance.org/publications/data/ 上找到。作者衷心感谢 CMF 和 Spandana 组织此次实验,感谢 Padmaja Reddy(Spandana 的首席执行官)致力于了解微型金融的影响,使此项目得以顺利完成,感谢 Annie Duflo(研究期间的 CMF 执行董事)负责此项目的设立,并感谢众多研讨会听众和同事提供富有见地的建议。†麻省理工学院经济系、NBER 和 J-PAL。电子邮件:banerjee@mit.edu ‡麻省理工学院经济系、NBER 和 J-PAL。电子邮件:eduflo@mit.edu § J-PAL。电子邮件:rglenner@mit.edu ¶Northwestern University Department of Economics and NBER. 电子邮件:c-kinnan@northwestern.edu 1 1 引言 在过去 10 到 15 年间,微型金融机构 (MFI) 迅速扩张:根据微型信贷峰会运动 (2012) 的数据,获得微额贷款的极其贫困家庭数量从 1997 年的 760 万增加到了 2010 年的 1.375 亿,增长了 18 倍以上。小额信贷激发了人们对快速减贫的热情和希望,最终在 2006 年为 Mohammed Yunus 和 Grameen Bank 赢得了诺贝尔和平奖,以表彰他们为减少全球贫困所做的贡献。不过,在过去几年里,对小额信贷的热情与强烈的反对声形成了鲜明对比。例如,2010 年 11 月,《纽约时报》刊登了一篇文章,该文章发表之际,印度境内出现了大量与过度负债有关的自杀事件。文章援引了安得拉邦(本研究的背景)官员 Reddy Subrahmanyam 的言论,指责 MFI 在“利用穷人赚取巨额利润”。他认为,“该行业 [已] 变得与它原本要取代的广受鄙视的村庄放高利贷者一样糟糕……放款人居住在社区内。至少你可以烧毁他的房子。这些公司就是抢劫后逃跑”(Polgreen and Bajaj 2010)。这场辩论中令人惊讶的是,相关证据相对匮乏。关于非常成功的企业家或欠债累累的借款人的轶事无法告诉我们微型金融对普通借款人的影响,更无法告诉我们获得微型金融对普通家庭的影响。即使关于小额信贷客户和非客户的代表性数据也无法确定获得小额信贷的因果效应,因为客户是自行选择的,因此无法与非客户进行比较。微型金融组织也会有选择性地选择某些村庄,而非所有村庄。这些问题使得对小额信贷的评估特别困难,直到最近,我们还没有足够严格的证据来进行评估。不过,情况在过去几年有所改变,因为不同的研究团队与不同的合作伙伴在不同的环境中开展了多项评估微额信贷的调查:摩洛哥(Crépon 等,2013)、波斯尼亚和黑塞哥维那 (Augsburg et al., 2013)、墨西哥(Angelucci 等,2013)、蒙古(Attanasio 等,2013)和埃塞俄比亚(Tarozzi 等,2013) 提供。本文介绍了其中最早的一项研究,即对规范性小额贷款群体贷款模式效果的首次随机评估,该模式的目标对象是可能不是企业家的女性。本研究还跟踪了所有评估中最长时间段内的家庭(在其所在地区推出该计划后的 3 到 3.5 年 1),这是必要的,因为许多影响可能只会在中期显现。这项实验是印度金融管理研究学院 (IFMR) 微额信贷中心 (CMF) 与当时印度发展最快的微额信贷机构之一 Spandana 之间的合作项目,具体实施方式如下。2005 年,我们在海得拉巴德的 104 个贫困社区中随机选择了 52 个社区,在其中开设了 Spandana 分行,而其余社区则没有。1 海得拉巴德是印度第五大城市,也是安得拉邦的首府,该邦是印度微额信贷扩张最快、最近也最具争议的邦。在每个地区引入微型金融 15 到 18 个月后,我们在每个社区平均调查了 65 户家庭,总计约 6,850 户家庭,进行了全面的家庭调查。与此同时,其他 MFI 也在实验组和对照组的家庭中开始运营,但实验组获得 MFI 贷款的概率仍比对照组高 8.4 个百分点(46%),实验组的借款者占比为 26.7%,而对照组的借款者占比为 18.3%。在首次结束时点调查两年后,我们再次对同一组家庭进行了调查。到那时,Spandana 和其他组织已开始在实验组和对照组中发放贷款,因此从小额信贷组织借款的家庭比例没有明显差异(实验组为 38.5%,对照组为 33%)。但实验组中的家庭贷款金额更大,并且借款时间更长。因此,这项第二次调查为我们提供了机会,让我们能够研究获得小额信贷对家庭和企业产生的一些长期影响。不过,由于我们比较的是借款时间较长的人与借款时间较短的人,而不是借款者与完全不借款的人,因此设置并不完美。由于完全有可能存在溢出效应或一般均衡效应(如 Buera 等人所分析的那样,2011 年),以及通过预期在需要时能够借款而产生的影响(例如,预防性储蓄减少,如 Ka1 在泰国记录的那样)。测量借款影响的另一种方法是在申请者中随机提供小额信贷。这种方法由 Karlan 和 Zinman(2010 年)率先提出,它使用信用评分模型中“边缘”客户的个体随机化来评估南非的消费贷款影响,并发现获得小额信贷会提高就业几率。作者使用相同的方法衡量了微额信贷对马尼拉小型企业的影响(Karlan 和 Zinman,2011)。不过,值得注意的是,这两项研究评估的项目略有不同:南非研究评估的是面向消费者的贷款,马尼拉研究评估的是面向现有企业家的“第二代”个人责任贷款。2Boski and Townsend, 2011,以及在印度的 Fulford, 2011,或通过对价格或工资的一般均衡效应(Giné and Townsend 2004)),我们在此重点关注简化形式/意向接受治疗估算值。我们会研究这类政策对从各种来源借款、消费、新企业创立、企业收入等的影响,以及对教育、健康和妇女赋权等其他人力发展成效的衡量指标的影响。在第一个结束时间点,虽然家庭确实从小额信贷机构借了更多钱,但总体借款率相当低(只有 26.4% 的符合条件的家庭借了钱,而非 Spandana 预期的 80%),而且部分贷款取代了非正式贷款。非正式借款减少,而总借款金额没有显著差异(尽管点估值为正值)。这本身就是当时令人惊讶的结果,但其他研究也得出了类似的结论:对小额信贷的需求不如预期重要,可能并不对应于对额外信贷的重要需求。我们发现,每人每月消费额和非耐用品月消费额没有明显差异。我们确实看到了对耐用品购买的显著积极影响。有证据表明,这部分是通过增加劳动力供应来实现的,部分是通过减少不必要的消费来实现的:家庭减少了在他们自己所说的“诱惑性商品”上的支出。因此,在我们的研究背景下,小额信贷在帮助部分家庭做出不同的跨期消费选择方面发挥着作用。不过,这并不是传统上预计微型金融会产生的唯一影响。它应该为业务创造提供主要动力。即使对于那些不坚持要求家庭在首次贷款时必须拥有企业(Spandana 就是其中之一)的贷款机构,通常也是如此,但他们仍然希望和期望借款能力最终能帮助家庭开办或扩大小型企业。(Spandana 的群体贷款产品说明谨慎地避免提及信贷与自营职业活动之间的自动关联,但确实指出“贷款用于平滑现金流(原文如此),主要用于生产目的”。2)获得信贷 15 到 18 个月后,家庭不太可能成为企业家(即拥有至少一家企业),但会在现有的企业(或他们创办的企业)中投入更多资金。平均值有所增加 2 为了让大家了解微型金融与创业之间的所谓关联的普遍性,我们查询了 Google 上“微型金融”的搜索结果,发现其中大约有 310 万条搜索结果,其中 135 万条(44%)还包含“创业”或“企业家精神”字样(检索时间为 2013 年 11 月)。 3 微额信贷之前已经存在的企业的利润,这完全是由于盈利能力的上限大幅提高所致。在第 5 百分位数到第 95 百分位数之间的每个分位数,企业的利润没有差异。与对照组相比,边际新商家的平均利润更低,而且在实验组中,边际新商家甚至不太可能有一名员工。三年后,实验组和对照组都可以获得小额信贷,但实验组的家庭有机会获得更长时间的贷款,实验组中的企业拥有的资产明显更多,盈利能力在第 85 个百分位数以上的企业现在的利润更高。不过,平均而言,商家规模仍然较小,利润也不高。换句话说,与大多数人的看法相反,在微额信贷对企业有帮助的程度上,它可能对利润最高的企业最有帮助。平均流量仍没有差异。我们发现,无论是 18 个月后还是 36 个月后,该计划对任何妇女赋权或人力发展成效都没有任何影响。此外,近 70% 符合条件的家庭没有获得小额金融机构贷款,而是更倾向于从其他来源借款(大多数家庭都会这样做)。在解读和推广这些结果时,必须注意一些事项。 首先,实验组和对照组之间的小额信贷接受率差异很小,即使在第一次结束时也是如此,这引发了两个问题:这会降低效力和精确性(尽管我们发现了一些显著影响),并且这意味着我们检测到的微额信贷影响是由边际借款人推动的,这些人是指在借款成本较高时不借款(因为他们可供选择的小额信贷机构较少或不想换社区),但在成本较低时会借款。其次,评估是在经济增长非常快的背景下进行的,这可能会降低或提高小额信贷的影响。第三,这是对盈利性微额信贷模式的评估,如果公益性微额信贷放款机构保持较低的利率,其积极影响可能会更大。第四,由于我们研究的 MFI 不提供任何商务培训或敏感性教育等补充服务,因此我们研究的是向女性提供贷款的纯粹影响,这些女性可能或可能不会将贷款用于自己的企业(尽管 Spandana 确实认为这些资金最终会用于此用途),我们确实发现女性拥有的企业在扩张。第五,该研究是在“边缘”社区(Spandana 最初对这些社区不感兴趣)开展的,而他们选择从随机抽样中排除的社区可能产生了不同的影响(Heckman, 1992)。因此,我们很高兴地发现,我们的研究结果与其他四项研究的结果高度一致,这四项研究分别在不同背景下研究了类似的计划。这让我们对研究结果的稳健性和外部效度充满信心。简而言之,小额信贷并不适合每户家庭,甚至大多数家庭,也无法带来一些支持者声称的神奇社会变革。这项政策的主要影响似乎是(也许并不令人意外),它允许一些家庭牺牲一些即时效用(诱惑性商品或休闲活动),以便为购买住宅或建立或扩大企业的一次性支出提供资金。乍一看,这些边缘业务似乎效率不高或利润不高,但可能需要更多数据和更多时间才能全面确定它们对个人、市场和社区的影响。2 Spandana 微额信贷产品及其背景 2.1 Spandana 及其微额信贷产品 在 2010 年印度微额信贷行业发生重大危机之前,Spandana 是印度规模最大、发展最快的微额信贷组织之一,2008 年 3 月有 120 万活跃借款人,而其在 1998-9 年运营的第一年只有 520 名借款人(MIX Market,2009 年)。从诞生地安得拉邦充满活力的城市 Guntur 起,它已扩展到该州和其他几个州。基本 Spandana 产品是 Grameen Bank 首次推出的规范性小组贷款产品。一个小组由 6 至 10 名女性组成,25-45 个小组构成一个“中心”。 女性需要共同负责其所在分组的贷款。第一笔贷款为 10,000,按市场汇率约为 200 美元,按 2007 年购买力平价 (PPP) 调整后的汇率则为 1,000 美元(世界银行,2007 年)。3 需要 50 周才能偿还本金和利息;9.2,而市场汇率为 1 美元兑 139 卢比。50. 除非另有说明,否则以下所有提及美元金额的用法均采用 PPP 术语。5 的利率为 12%(非递减余额;相当于年利率 24%)。如果群组中的所有成员都偿还了贷款,则他们有资格申请第二笔 10,000-12,000。贷款金额最高可达 20,000。在研究过程中,Spandana 还针对已成功完成一到两轮群体贷款周期的客户推出了个人产品。个别产品在治疗区域有售。不过,样本中的极少数人最终选择了此类贷款,因此该研究主要评估的是群体贷款产品。我们根据以下条件来确定客户是否符合资格条件:客户必须(a)为女性(b)年龄在 18 到 59 周岁(c)在同一地区居住至少 1 年(d)持有有效的身份证件和居住证明(配给卡、选民证或电费单),以及(e)群组中至少 80% 的女性必须拥有自己的住房。4 群组是由女性自己组成的,而不是由 Spandana 组成的。与其他一些微型金融组织不同,Spandana 不要求客户开办企业(或假装开办企业)才能借款:该组织认为金钱是可替代的,只要客户能按时偿还贷款,他们可以完全自由地选择如何使用这笔钱。Spandana 不会根据投资的预期效益来确定贷款资格,但在选择加入小组时,可能会排除那些无法说服同小组成员自己有能力偿还贷款的妇女。此外,与其他微型放款机构(最值得注意的是 Grameen)不同,Spandana 并不明确坚持要让家庭发生“转变”。小组会议不会诵读决议,会议时间很短,主要围绕还款交易进行。Spandana 主要提供贷款服务,并不直接参与业务培训、金融知识普及等活动。不过,管理层认为,借款本身就会带来这种转变,并促成创业。Spandana 也是一家盈利性运营商,收取的利息足以盈利,但在我们研究的时期,所有利润都被重新投资到该组织。该组织获得了私人资本,如果没有陷入安得拉邦危机,可能还会发起 IPO。这与格莱珉银行不同(在墨西哥大型 MFI 公司 Compartamos 首次公开募股后,Mohammed Yunus 明确而强烈地批评了盈利性 MFI)。在解读这项研究的结果时,请务必注意所有这些特征:Grameen 产品可能会产生不同的影响。4 对于自有住宅,要求并非出于将住宅用作抵押品的考虑,而是因为自有住宅的所有者更稳定,不太可能迁移。Spandana 不需要正式的房产所有权证书,只需要一个一般性协议,证明这栋房子属于这个家庭(即使是在非正式社区,这点也往往很明确) 6 从评估角度来看,这款产品具有明显的优势:尤其是,对业务扩张产生的任何影响都可以归因于信用,而不是其他服务。此外,如果我们在研究中发现“积极”结果,这些结果不太可能归因于社会期望偏差。另值得注意的是,在我们研究的时期,Spandana 收取的利息率与标准微额信贷标准(甚至 Grameen 标准)相比都很低。2.2 背景信息表 1A 使用基准数据来显示 Spandana 产品发布之前(2005 年)研究区域的家庭情况。正如我们在下文中所述,这些数据需要谨慎看待,因为基准调查时抽样的家庭不一定代表整个地区,并且我们在结束时也没有刻意重新调查。在基准期,平均家庭为五口之家,每月支出略低于 5,000 美元,或按 PPP 调整后的汇率计算为 540 美元(人均 108 美元)(世界银行,2005 年)。5 在基准期,样本地区几乎没有小额金融机构借款。不过,68% 的家庭至少有 1 笔未偿还的贷款。平均未结金额为 38,000。63% 的家庭从非正式渠道(放款人、朋友或邻居、家庭成员或商店老板)获得了贷款。商用银行贷款非常少见(3.6%)。 虽然企业投资不是借款的常见动机,但企业很常见,每 100 个家庭就有 32 个企业,而经合组织国家平均有 12% 的受访者表示自己是自雇人士。不到半数的企业由女性经营(每 100 个家庭中有 14.5 个由女性经营的企业)。企业主及其家人每周平均在企业中工作 58 小时。2005 年至 2010 年的增长率 表 1B 显示了对照组中基准组 1 和基准组 2 (EL1 和 EL2) 样本的一些相同关键统计数据。 将对照组基准样本 (2005) 与 EL1 (2008) 和 EL2 (2010) 样本中的对照户家庭进行比较,发现海得拉巴德在 2005-2010 年间出现了非常快速的世俗增长。6 平均而言,这些差异均不显著(第 5 列)。6 虽然基准调查不是针对相同的样本进行的,因此比较结果可能并不完全准确,7 家庭消费从 4,888(2005 年)至 7,662 卢比,2008 年为 2010 年为 11,497 人(所有数据均以 2007 年卢比表示)。至少有 1 笔未偿还贷款的家庭比例从基准期的 68% 上升到了 EL1 期的 89% 和 EL2 期的 90%。企业的普及率从基准期的每 100 户家庭中有 32 户拥有企业,增加到 EL1 期的 44 户,EL2 期的 56 户。在基准组 1 中,37.8% 的企业由女性经营;在基准组 2 中,40.3% 的企业由女性经营。不过,这些企业仍然非常小,EL1 的平均员工数为 0.38 人,EL2 为 0.18 人。7 除了在员工人数方面仍然非常小之外,平均销售额也保持相当稳定:Rs. 在 EL1 为 14,800,在 EL2 为 14,100。不过,如果将所有家庭(而不仅仅是拥有企业的家庭)纳入考量范围,则企业收入从约 4,800 至 5,800(以 2007 年不变卢比计算)。在 EL2 级别,企业主报告的经营费用(流动资金)加上资产投资金额接近 15,000 印度卢比,高于约 13,000 在 EL1 时。(这些费用估算不考虑店主的工时费用。) 安得拉邦城镇快速增长的背景是另一个值得注意的重要特征,可能会影响这项研究的结果(在所有微金融随机评估中,这可能是最具活跃性的背景)。这显然是一个重要的例子,因为印度的微型金融客户约占全球所有微型金融客户的 30%,8 而且微型金融在许多其他快速发展的环境中也得到了发展(孟加拉国可能是最典型的例子)。但在增长速度缓慢或经济衰退的情况下,结果可能会有所不同。幸运的是,其他 RCT 研究涵盖了各种各样的背景,这有助于了解结果在多大程度上取决于背景。3 实验设计 3.1 实验设计 在本研究开始时,微型金融已在安得拉邦的几个地区扎根,但大多数微型金融组织尚未开始在该州的其他地区开展工作。7EL1 和 EL2 之间平均就业人数的下降可能反映了组成结构效应,即边际企业规模较小。8MIX Market 报告称,2011 年全球有 9,400 万借款人,其中 2,800 万位于印度 (http://www.mixmarket.org/mfi/country/India)。8 海得拉巴。Spandana 最初选择了海得拉巴德的 120 个区域(可识别的社区或 basti),这些区域是他们有意开设分店,但也愿意不开设分店的区域。这些地区之所以被选中,是因为它们之前没有微型金融机构,并且居民是理想的潜在借款人:贫穷,但不是“最贫穷的人”。我们避免了建筑工人密集的区域,因为他们经常搬迁,因此不适合成为微额信贷客户。虽然所选区域通常被称为“贫民窟”,但这些都是永久性聚居区,拥有混凝土房屋和一些公共设施(电力、水等)。相反,由于 Spandana 非常希望在这些最大的贫民窟开展业务,因此并未将其纳入研究范围:这些贫民窟的人口众多,使他们能够受益于规模经济,并能够快速覆盖大量客户,从而证明在该城市扩张是合理的。我们为研究选择的社区的人口数量介于 46 到 555 户之间。为避免实验组和对照组贫民窟之间出现溢出效应,我们选择的研究对象通常不是连续的贫民窟。在每个地区,CMF 首先于 2005 年聘请一家市场研究公司开展了一项小规模的基准社区调查,收集了有关家庭组成、教育、就业、资产所有权、支出、借款、储蓄以及家庭目前经营或在过去一年内停止经营的任何业务的信息。他们共调查了 2,800 户家庭,以便快速评估这些社区的基准条件。不过,由于没有现有的人口普查数据,并且必须在 Spandana 开始运营之前快速开展基准调查,以便收集进行分层所需的一些信息,因此并未从户名单中随机选择家庭:而是要求现场工作人员绘制该区域的地图,然后选择每 n 个房屋中的第 n 个房屋,其中 n 的值为每区域选择 20 个家庭。很遗憾,市场调研公司并未严格遵循此流程,因此我们不确定基准数据能否代表整个贫民窟。因此,基准调查仅用于分层、上述描述性分析,以及收集用作控制变量的区域级特征。9 除此之外,我们不会在后续分析中使用基准调查。在基准调查之后但在随机分配之前,我们从研究中剔除了 16 个区域,因为发现这些区域包含大量外来务工家庭。9 不过,忽略这些控件对结果没有影响。9 Spandana(与其他 MFI 一样)有一条规定,即仅向在同一社区居住至少一年的家庭发放贷款,因为该组织认为,动态激励措施(承诺日后提供更多信贷)在激励这些家庭偿还贷款方面更为重要。10 其余 104 个地区根据人均平均消费和每户债务情况分为成对相似的社区,然后从每对社区中随机选择一个社区分配到实验组。11 图 5 显示了数据收集和随机分配的时间表。 表 1 使用基准样本来表明,在基准调查中,实验组和对照组在受众特征、财务状况或创业特征的基准水平方面没有差异。这并不奇怪,因为样本是按人均消费和有债务的家庭比例进行分层的。然后,Spandana 在 2006 年至 2007 年期间逐步开始在 52 个治疗区域开展业务。不同贫民窟的推出日期有所不同。请注意,在实验期间,其他 MFI 也在实验组和对照组地区开始运营。我们将在下文中证明,实验组和对照组的 MFI 借款仍存在显著差异。Spandana 信贷主管还开始在极少数对照贫民窟中提供贷款,但这种做法很快就停止了。此外,没有任何规定禁止在其他贫民窟借款(如果能找到加入的组织),有些人确实这样做了。总体而言,在实验结束时,对照组贫民窟中有 5% 的家庭在向 Spandana 借款。为了为结束时点调查创建适当的抽样框架,CMF 工作人员于 2007 年初对每个地区进行了全面的普查,并在其中加入了有关借款的问题。普查结果显示,即使在实验组地区,小额信贷机构的借款率也较低,因此基准组抽样框架由具有以下特征且很可能已借款的家庭组成:在该地区居住至少 3 年,且至少有一名年龄在 18 至 55 周岁的女性。我们认为,在普查中确定的 Spandana 借款人过度抽样,因此这些差异与 Spandana 剔除省略区域的理由一致:这些地区的家庭规模较小(因为那里的外来务工人员没有家庭或孩子);企业创建数量较少(可能是因为外来务工人员不太可能创业);未偿还的贷款较少(可能是因为非正式放款人也不愿意向这些流动性很强的家庭放款)。(结果可供申请。) 我们构建了 11 对组合,以最大限度地减少组合 A、B 的总和:(area A avg loan balance – area B avg loan balance)2 + (area A per capita consumption – area B per capita consumption)2。在每一对中,一个社区会被随机分配到实验组。10 处理效果的异质性会导致 Spandana 借款者获得的结果比非借款者获得的结果更不一致,因此,过度抽样借款者会提高统计效力。下面显示的结果会对观察结果进行加权,以反映这种过采样,从而确保结果能代表整个群体。由于基准期的抽样框架不够严格,因此在跟踪调查中并未刻意对基准期家庭进行重新调查。第一个基准调查于 2007 年 8 月开始,2008 年 4 月结束,基准调查的实施时间紧随该计划的实施时间。在每个地区,这项首次结束时点调查都是在 Spandana 开始在该特定地区发放贷款至少 12 个月后进行的,通常是在 15 到 18 个月后进行的(在对照贫民窟,调查遵循相同的时间表,以确保实验组和对照组具有可比性)。总样本规模为 6,864 户家庭。两年后,在 2009-2010 年,我们对同一批家庭进行了第二次结束时调查。该调查问卷包含与 2007-2008 年相同的问题,以确保可比性。再联系率非常高(90%)。我们将在下文中详细介绍这种流失情况。 3.2 识别结果的潜在威胁和解读注意事项 3.2.1 流失和选择性迁移 由于我们没有系统跟踪的适当基准样本,因此可能存在一个潜在问题,即如果实验组和对照组存在不同的流失率,那么在结束时调查的样本在实验组和对照组之间可能无法严格比较。例如,由于 Spandana 在该地区开展了业务,人们可能会搬到该地区或避免搬离该地区。这似乎不太可能,因为如果有人真的想借钱,他们可以选择从其他 MFI 借款(我们会看到,有相当一部分人确实这么做了),甚至可以前往邻近社区,从 Spandana 借款。实验组的借书体验仅略微有所改善(如我们将在下一部分中看到)。不过,事后看来,我们没有尝试对基准样本中的至少一部分人进行系统性重新调查,这显然是一项错误,即使基准抽样框架不太理想也是如此。不过,我们有许多方法可以评估流失程度。首先,在表 A1 中,我们验证了在基准线 1 和 2 调查的家庭在实验组和对照组中是否具有类似的特征(在实验组中,这些特征在 11 个月内保持不变,基准线 1 和基准线 2 的联合差异的 p 值分别为 0.980 和 0.534)。这表明,即使考虑到流失,基准组和结束组的样本也具有可比性。第二,EL1 的样本来自于在微额信贷引入后不久(平均不到一年)进行的普查。此外,EL1 的抽样框架仅限于在人口普查前至少已在该地区生活了 3 年的人。这意味着,受访者中没有人是因为 Spandana 而迁入该地区的:他们都是在 Spandana 迁入该地区之前就已经是该地区的居民(其中绝大多数人已经居住多年)。这样可以消除实验组和对照组样本中差异选择的最可能渠道。在产品发布和人口普查之间,由于可以更轻松地借款,离开实验组区域的人数(或其他人)可能有所减少,但在不到一年的时间里,离开海得拉巴德的迁移率很低,而且鉴于人们可以根据需要借款,因此根据成为 Spandana 客户的可能性来判断人们离开贫民窟的可能性似乎不太合理。然后,我们可以研究普查与 EL1 之间的流失率,以及 EL1 与 EL2 之间的流失率。在人口普查和 EL1 之间存在一些流失,尤其是因为,按照这类调查的惯例,人口普查调查员会获得替换名单,以防他们找不到所需的确切对象。不过,实验组和对照组的流失率(大约 25%)几乎完全相同:实验组为 27.6%,对照组为 25.2%(差异的 p 值为 0.165;请参阅表格 A2,面板 A)。此外,流失率与 Spandana 进入贫民窟以来经过的月份完全没有相关性(表 A2,面板 B)。如果流失率与该计划有某种关联,我们预计会看到不同的结果(如果 Spandana 进入贫民窟的时间更长,流失率应该会更高)。唯一可预测某人更有可能被找到的特征是,他们是 Spandana 借款人(流失率降低了 4.2 个百分点;标准误差为 1.97 个百分点),并且住在“非普卡”(质量较低)的房子里(流失率降低了 2.7 个百分点;标准误差为 1.4 个百分点)。前者最可能的原因是,Spandana 官员帮助 CMF 外勤团队找到了客户。例如,土地测量员可以参加每周会议,收集地址并查找前往用户住宅的路线。后者可能反映了富裕家庭的流动性更高。在接下来的所有分析中,我们都会根据找到非 Spandana 借款人的概率与找到 Spandana 借款人的概率 (0.948) 之间的比率来调整 12 个抽样权重,以对此进行修正。附录表 3,面板 A 显示,在基准期 2 时,最初在基准期 1 时接受访谈的家庭的再联系率非常高(比美国或发展中国家/地区的大多数随机对照试验高得多)。实验组和对照组的留存率也相差无几,分别为 89.9% 和 90.2%(差异的 p 值为 0.248)。面板 B 显示了重新联系的家庭与流失的家庭的平均特征。在大多数维度上,这些样本没有明显差异。不过,在基准线 1 时,流失用户的人均支出略高,为 支出增加 1,000 美元,流失几率会增加 0.0098(第 1 列:标准误差为 0.0032)。在基准期结束时(第 1 个基准期)获得 Spandana 贷款与流失率降低 3.3 个百分点相关(第 5 列:标准误差为 1 个百分点);获得任何 MFI 贷款与流失率降低 2.7 个百分点相关(第 6 列:标准误差为 0.8 个百分点),这与 Spandana 贷款的影响有关。再次说明一下,之所以出现这种情况,是因为如果客户在贫民窟内搬迁了,信贷专员会帮助现场团队找到客户。表 A3 的面板 C 显示,在实验组和对照组之间,流失率与特征之间没有差异相关性。这些数据表明,没有证据表明迁移或流失模式是由实验组带来的,除了 Spandana 信贷专员帮助调查员找到客户的机制性影响之外(我们已对此进行了修正)。不过,为了系统地解决“流失可能会影响结果”这一问题,我们重新估算了以下所有回归,并根据 Dinardo、Fortin 和 Lemieux (2010) 提出的样本选择修正方法,使用第 2 个基准期被观察到的倾向性因子的倒数对数据进行重新加权,以便第 2 个基准期被观察到的家庭中可观察特征(在第 1 个基准期)的分布与整个第 1 个基准期样本中的分布相似。然后,我们将相同的权重应用于基准组 1 数据(隐式假定微型金融项目开始实施和基准组 1 之间存在类似的选择过程)。表 A5 中针对主要结果显示的结果与我们在此处显示的结果非常相似。(如需完整结果,请与我们联系。)请注意,此过程仅会根据可观测变量,而非不可观测变量来修正流失差异。13 解读结果 实验设计和实现会带来一些问题,在解读后续结果时需要注意这些问题。首先,鉴于抽样框架,我们将对“可能的借款人”样本进行意向治疗 (ITT) 分析。因此,这既不是对借款者的效应,也不是对社区的平均效应。而是指更容易获得小额信贷对主要目标群体产生的平均影响。其次,实验组和对照组地区均提供小额信贷服务,但在实验组地区,获得小额信贷服务更为容易。实验组地区的微型金融普及率确实更高,这会产生实验差异,但边际客户可能与某个地区最早的借款客户不同。这也会影响功率:在进行初始功率计算时,Spandana 认为 80% 符合条件的家庭会在该服务发布后非常迅速地成为客户。事实上,数据显示,该比例在 18 个月内仅达到 18%(并且在两年半后仍保持在 18%)。这是一个较低的渗透率,也给了在海德拉巴的渗透率落后于 Spandana 的其他 MFI 追赶的时间。总体而言,到 EL2 时,从任何组织获得微额信贷的人数仅占 33%。这本身就是一项重要的结果,在当时也非常令人惊讶,但这也意味着,如果能从后见之明的角度来看,我们需要覆盖更多领域。这不是事后可以解决的问题。幸运的是,随后对微型金融计划的评估能够做到这一点,并发现了非常类似的一组结果(和非结果),这表明这些结果并非样本过小或客户群体不具代表性所致。4 结果 为了估算在某个地区推出微额信贷对潜在客户的影响,我们重点关注意向接受治疗 (ITT) 估算;即,对实验组和对照组的平均值进行简单比较,并对借款者和非借款者进行平均。我们通过 ITT 估算了微型金融对家庭经营的企业的影响;对于拥有企业的受访者,我们会考察企业利润、收入、企业投入以及企业雇佣的工人数量。(这些变量的构建方式在附录 1 中进行了介绍。)每个表的每个列都报告了以下形式的回归结果:yia = α + β × T reatia + X 0 aγ + εia,其中 yia 是区域 a 中第 i 个家庭的结果,T reatia 是居住在受试区域的指标,β 是意向治疗效果。X 0 a 是一个控制变量矢量,计算方法为地区级基准值:地区人口、企业总数、人均支出、识字的户主所占比例,以及所有识字成年人的比例。标准误差经过调整,以反映地区一级的聚类,并且所有回归都经过加权,以修正 Spandana 借款人的过采样,并提高跟踪他们的概率。我们估算了两组具有不同规范的回归:完全不控制,以及控制层级(而非对照贫民窟的平均特征进行控制)。结果(此处未报告,但可应要求提供)在质量上没有变化。在本例中,控制层级会略微提高精确性,因此这里一些几乎显著的结果在控制层级后变得显著(对于分组结果,这一点尤其如此)。在任何此类研究中,如果存在许多可能的结果,但没有单一的可能因果路径,就有可能过度解读任何单个显著结果(甚至在没有结果的情况下,也能辨别出结果模式)。我们会采取多种措施来避免此问题。首先,我们会按照本期所有论文遵循的模板报告结果,确保不会根据结果是否显著而选择结果。其次,对于每个表(对应于结果的“族群”),我们都会报告该族群中所有结果的汇总指数(如 Katz、Kling 和 Liebman [2007] 所述)。12 最后,对于这些结果中的每一个,我们都会报告标准的 p 值,以及针对所有指数进行的多重假设检验而调整后的 p 值。调整后的 p 值是使用 Hochberg (1988) 的降序法则计算得出的,该法则可控制所有指数的家族误差率。如需了解详情,请参阅附录 A.4。 12 变量带有符号,正处理效应表示“良好”结果。然后,通过减去对照组的均值并除以对照组的标准差对其进行标准化处理。该指数是标准化变量的简单平均值。15 4.1 从 Spandana 和其他 MFI 借款 实验组社区被随机选中,以便获得 Spandana 分支机构,但其他 MFI 也开始在实验组和对照组地区开展业务。我们希望测试获得小额信贷的影响,而不仅仅是从 Spandana 借款的影响。表 2 面板 A 显示,在第一次结束时点,实验组贫民窟的 MFI 借款确实高于对照组贫民窟,但从其他 MFI 借款弥补了 Spandana 借款差异的一部分。与对照组相比,实验组的家庭更有可能报告自己是 Spandana 的借款人,差距为 12.7 个百分点,分别为 17.8% 和 5.1%(表 2,面板 A,第 1 列)。表示从任何 MFI 借款的家庭所占百分比的差异为 8.4 个百分点(表 2,面板 A,第 3 列),因此,在实验组中,一些最终从 Spandana 借款的家庭在没有干预的情况下本应会从其他 MFI 借款。虽然 MFI 总借款的绝对水平并不高,但实验组的借款量比对照组高出约 50%。第 1 列和第 3 列显示,与对照组家庭相比,实验组家庭从小额信贷机构(尤其是 Spandana)借款的金额也明显更高。对借款者和非借款者进行平均,实验组家庭报告的收入为 从 Spandana 借款的家庭比对照组家庭多了 1,334 次,而借款金额所有 MFI 的贷款申请量增加了 1,286 笔(两者在 1% 的水平上均具有显著统计意义)。虽然绝对的使用率和隐含的“第一阶段”都相对较小,但这似乎与大多数其他评估微金融普惠影响的结果相似,尽管背景不同。Crépon 等人 (2013) 在摩洛哥农村发现,在可以获得该服务的地区,从小额金融机构 Al Amana 获得任何贷款的概率为 10%,而在对照组中,该概率几乎为零;此外,由于没有其他小额金融机构,因此这代表了小额信贷借款总量的增加。Angelucci、Karlan 和 Zinman (2013) 在墨西哥发现,与对照组的 5 个百分点相比,能够获得该放款机构服务的地区从该 MFI 借款的概率提高了 10 个百分点。在埃塞俄比亚,Tarozzi 等人 (2013) 发现,微额信贷的引入产生了更大的影响:36%。鉴于这些社区的非正式借贷比例很高,并且小额信贷相较于这些替代借贷形式的声称优势,这些不同情境中相当低的采用率本身就是一个惊人的结果。在所有情况下,除了在已明确表示对小额信贷感兴趣的受众群体中进行随机抽样之外,只有少数 16 名“可能的借款人”最终会借款。表 2 还显示了获得微额信贷对其他形式的借款的影响。有相当一部分客户表示,他们之所以从 Spandana 借款,是因为要偿还利率较高的债务,我们确实发现了一些这方面的行为。在实验组中,有一定程度的非正式借款(定义为向亲戚、朋友、放款人借款,以及通过卖家提供的赊账购买商品)的家庭比例下降了 5.2 个百分点(第 5 列),但银行借款未受影响(第 4 列)。从非正式渠道借款的点估计值也是负值,这表明高成本借款被更便宜的 MFI 借款取代(这是 Spandana 的明确目标),而且虽然点估计值不显著,但其绝对值与 MFI 借款增加幅度(第 5 列)非常相似。不过,鉴于非正式借贷的比例很高,这相当于下降了 2.6%:如图 1 所示,我们在研究基准期结束时非正式借贷的分配情况时发现,在治疗组中,从第 30 到第 65 个百分位,非正式借贷的比例明显较低。总体而言,治疗组会影响借用结果的得分,即使考虑到跨家庭的多次假设检验(第 9 列),p 值也较小。第一个目标完成后,根据我们与 Spandana 达成的初始协议,Spandana 开始在这些领域扩展。其他 MFI 也继续扩张。不过,两年后,Spandana 贫民窟与其他贫民窟之间仍然存在显著差异:表 2 面板 B 显示,实验组贫民窟中有 17% 的家庭从 Spandana 借款,而对照组贫民窟中有 11% 的家庭从 Spandana 借款。其他 MFI 在原来的实验组和对照组贫民窟中继续扩张,实验组和对照组的 MFI 贷款总体上几乎相同。根据第二次结束时进行的调查,在原对照贫民窟中,33.1% 的家庭曾向小额金融机构借款,在实验组贫民窟中,这一比例为 33.3%。不过,由于对照组的贷款发放时间较晚,实验组的家庭平均借款时间比对照组的家庭长,这反映在他们完成了更多贷款周期的事实上。在基准期 2 时点(第 8 列),实验组和对照组之间的平均差异为 0.085 个贷款周期,与基准期 1 时点相比几乎没有变化。13 因此,基准期 2 时点实验组和对照组之间的主要差异在于贷款周期长度。13 在基准期 2 时点,差异不再显著,这可能是因为回忆错误,以及我们仅收集了从任何 MFI 借款的最大周期数的信息,因此此数据无法区分,例如,从两个贷款人各借了三个周期的家庭与从一个贷款人借了三个周期的家庭。 17 人获得了小额信贷服务。由于小额信贷会随着每个周期而增加,因此实验组家庭获得的信贷也更多。在借款者中,到基准线 2 时,差异非常显著,约为 2,300 美元(或 14%)的贷款金额(未报告)。由于约三分之一的家庭会借款,因此这意味着差异(不显著)约为 平均借款金额为 800 美元(第 3 列)。4.2 新业务和业务成效 表 3 的面板 A 显示了第一个基准期对业务成效的评估结果。第 8 列表明,实验组和对照组的家庭创业概率实际上没有显著差异。在对照组地区,4.7% 的家庭在调查前一年开设了至少一家企业,而实验组地区则为 5.6%(第 8 列)。不过,实验组家庭在过去一年内开设多家商家的可能性略高,第 10 列显示,实验组地区总体上开设了更多新商家:每 100 户家庭中有 6.8 家,而对照组每 100 户家庭中有 5.3 家。新企业创建情况的 90% 置信区间为:新增企业数量增加 0.3 个百分点到 2.6 个百分点。总体而言,实验组家庭不太可能拥有企业,也没有明显更多的企业(第 6 列和第 7 列)。与 Spandana 仅向女性提供贷款这一事实以及微额信贷机构的既定目标相符,边际企业往往由女性经营:第 11 列显示,当我们观察由女性拥有的企业的创建情况 14(第 11 列)时,发现实验组中由女性经营的企业数量比对照组多了 0.014 个百分点,增幅为 55%。受影响区域的家庭不太可能报告关闭企业,受影响区域的 3.9% 的家庭和对照区域的 3.7% 的家庭报告了此类事件(第 9 列)。15 受影响区域的家庭会在企业的耐用品方面投入更多资金。由于只有三分之一的 14A 企业在回答“此商家的所有者是谁?”这一问题时,首先提及的人员是女性,因此我们将其归类为女性所有。在 2674 家商家中,只有 72 家有多个所有者。如果任何被列为所有者的人员是女性,则将商家归类为女性所有不会改变结果。15 未纳入样本的家庭(例如未在该地区居住满三年的家庭)在关闭受影响地区的商家方面的可能性可能有所不同。不过,由于新企业的数量相对较少,因此新企业对现有企业的一般均衡影响不太可能。18 户家庭拥有企业,并且大多数企业不使用任何资产,因此点估值的绝对值较小(卢比391 卢比,即略低于实验组家庭平均小额金融机构借款增加额的三分之一),但实验组的增幅超过了对照组家庭去年购买的商用耐用品总价值(2,280),具有统计显著性。 表 3 的面板 A 中其余列报告了当前的业务状态以及上个月的收入、投入成本和利润(不包括利息支付)。在这些回归分析中,我们会将没有经营业务的家庭设为 0,因此这些结果可让我们了解信贷对业务活动的总体影响,包括扩张性和集约性边际效益。实验组家庭拥有更多的企业资产(尽管资产存量 t 统计量仅为 1.56)。处理对收入和投入的影响均为正,但不显著。 最后,企业利润(第 5 列)的增幅不大。由于这些数据包含没有经营业务的家庭的零值,因此可以回答以下问题:小额信贷是否像人们通常认为的那样,通过扩大贫困家庭的创业机会来增加其收入。点估算值为 354 美元,与对照组平均家庭获得的利润相比,增加了约 50%。因此,这与利润相比是巨大的,但对于普通家庭来说,这只会使可支配收入增加很少。请注意,这些家庭的平均总消费约为 7,000 印度卢比,比上个月增加了 每月 354 美元的收入肯定不会改变获得小额信贷的普通人的命运。综合考虑所有业务结果,我们发现业务结果标准化指数增加了 0.037 个标准差,这在采用传统标准误差时具有显著性,但在考虑不同结果系列的多重假设检验后,则不具有显著性(p 值为 0.17)。16 这是 ITT 估算值,其偏低的部分原因在于,实验组中很少有家庭利用了小额信贷(对照组中也有少数家庭利用了小额信贷)。与对照组中对借款有足够兴趣的借款人相比,实验组中的边际借款人获得的机会也可能更少。这并不排除某些特定群体的企业可能从贷款中受益。为了更详细地了解这一点,我们重点关注在微额信贷开始之前就已存在的企业。16 即使在控制了层级虚拟变量后,这一结果依然显著 19我们在表 3B.17 中进行了此项处理。对于 Spandana 扩展之前存在的企业,我们发现企业(销售额、投入和投资)有所扩大,并且即使在对多重推断进行校正后,整体业务指数也显著为正(标准差为 0.09,校正后的 p 值为 0.057)。我们发现,利润平均增加了 2,206,与对照组平均值 2,000 印度卢比。这种增加并非由少数离群值造成的;不过,值得注意的是,它集中在上尾(第 95 个百分位数及以上),如图 2 所示。在所有其他百分位段,实验组和对照组中现有企业的利润相差无几。有 75 家商家的月利润高于第 95 百分位数,因此并非少数,但现有商家的月利润第 95 百分位数为 14,600 美元(按 PPP 计算为 1,590 美元),这使得这些企业在这种情况下规模较大且利润丰厚。绝大多数小型企业一开始利润就很低,小额信贷对它们毫无帮助。研究发现,小额信贷最有效的用途是帮助已经盈利的企业,这与小额信贷的许多说辞和小额信贷怀疑者的观点相悖。最后,我们发现该实验组促成了更多企业的创立,尤其是女性拥有的企业。在图 3 和表 3C 和表 A4 中,我们展示了有关这些新商家特征的更多数据。图 3 中的百分位回归(基准期不存在的企业的利润)显示,在基准期不存在的企业中,位于第 35 和第 65 百分位之间的所有企业在实验组地区的利润都显著降低。表 4 的第 5 列显示,由于数据存在噪声,实验组和对照组的平均利润没有显著差异,但实验组的新业务中位数为 利润减少了 1,250 美元,在 5% 的水平上具有显著意义(未在表格中报告,但在图表中显示)。平均而言,新开设的商家在实验组地区拥有员工的可能性也显著降低:每家新开设的商家拥有的员工数量从 0.29 降至仅 0.11(第 6 列)。对于新企业,所有结果的指数均为负数(标准差为 0.081),在传统水平下具有显著性,但在对多重推断进行校正后则不具有显著性(p 值为 0.028)。这些结果在原则上可能是治疗效果和选择效应的组合,17 在表 3 中,我们表明家庭在过去一年内关闭企业的可能性不高也不低,因此没有因微额信贷而产生的样本选择。20 但由于对现有企业的影响表明,对大多数企业而言,处理效应接近于零(并且点估计值为正值),因此对新企业的影响可能源于选择偏差:在实验组地区开业的边际企业的利润低于对照组地区的边际企业。附录表 4 进一步支持了“启动边际企业的行为在实验组中有所不同”这一假设,该表格比较了实验组和对照组中旧企业和新企业的行业。18 行业是企业平均规模和资本密集度的替代指标,与实际规模或资产使用相比,衡量行业时误差可能更小。新企业的行业构成确实有所不同。具体而言,与对照组新开办的企业相比,实验组新开办的食品企业(茶/咖啡摊、食品供应商、基拉纳/小型杂货店和农业)所占比例高出 8.5 个百分点(约 45%),而人力车/驾驶企业所占比例低了 5.4 个百分点(超过 50%)。这两个差异在 10% 的水平上都具有显著性。在这些地区,食品企业是资本密集度最低的企业,平均资产价值仅为 930(主要包括 dosa tawas、锅和平底锅等)。 需要租车或拥有车辆的三轮车/驾驶业务是资本密集度最高的业务,平均资产价值为 12,697 美元(其中大部分是车辆费用)。如果微额信贷的利率低于家庭可获得的其他贷款来源的利率,则预计会降低创业盈利的最低要求。这两项结果的另一种解释可能是,由于 Spandana 向女性提供贷款,边缘企业更有可能由女性拥有,因此是在女性活跃的行业中创立的。此外,由女性经营的企业通常利润较低,这可能是因为社会对她们能做什么以及能为企业投入多少精力施加了限制。19 表 3 的面板 B 显示了第二个基准时间点的企业绩效变量的结果。如前所述,此时实验组和对照组家庭获得小额信贷贷款的可能性相同,但实验组的贷款金额更大,且借款人 18 受访者可以将自己的业务分为 22 种不同的类型,我们将其分为以下几类:食品、服装/缝纫、人力车/驾驶、维修/建筑、手工艺品供应商和“其他”。 19 这在这些数据中得到了证实,例如,de Mel 等人(2009 年)在斯里兰卡也发现了这一点。21 个国家/地区的用户借款时间较长。结果遵循一个明确的模式,与控制组家庭现在以相同的利率借款的观点一致。我们发现,实验组和对照组在企业创建方面没有显著差异:点估计值几乎为零(90% 置信区间介于新企业减少 2 个百分点到增加 2.5 个百分点之间)。实验组和对照组中的新商家都属于同一行业,中位数新商家的负面影响已消失(省略了结果)。对于同期的流量投资结果(例如新业务创建、上一年获得的企业资产等)(第 8 至 11 列),点估值非常接近零(但标准误差较大)。另一方面,实验组中的企业拥有明显更大的资产存量(第 1 列),这反映了过去几年内他们有机会借款和扩张所产生的累积效应。尽管如此,他们的利润仍没有显著增加,尽管点估计值约为样本均值的 60%(t 统计量约为 1.5)。如图 4 所示,正增长率再次集中在两端,但开始出现正增长的时间稍早,在第 85 个百分位数。总体而言,微型金融确实与(某些)企业创立有关:在第一年,它确实会导致新企业数量增加,尤其是女性创立的新企业数量(但不会增加创业家庭数量)。不过,这些边缘企业的规模甚至比该地区的平均企业还要小,利润也更低(该地区的大多数企业规模已经很小,利润也微乎其微)。这还会促使企业加大对现有业务的投资,并提高这些业务中利润最高的业务的利润。而对于其他所有人,企业利润不会增加,平均而言,小额信贷不会显著帮助企业实现增长。即使过了三年,在 Spandana 开始运营之前就已存在的企业的员工数量也没有增加。4.3 劳动力供应 获得信贷可以增加劳动力供应,以便为投资或购买以前因储蓄和借贷限制而无法企及的耐用品提供资金。在这一领域,对小额信贷的不同评估得出截然不同的结果,从 Augsburg 等人 (2013) 发现青少年劳动力供应令人担忧地增加,到 Crépon 等人 (2013) 发现所有人的劳动力供应大幅减少。表 5 显示了该计划对劳动力供应的影响。在 22 年基准调查 1 中,实验组家庭的户主和配偶的总劳动力供给量平均增加了 3.18 小时(90% 置信区间:0.84-5.5)。这种增加完全发生在家庭自营的企业中,而受薪工作时间则没有增加:如果家庭没有完全选择这些工作时间,那么这些工作时间的弹性可能会大幅降低。不过,我们没有发现青少年劳动力供应增加的情况,而这有时被视为微额信贷的潜在负面影响,并且在波斯尼亚研究中也发现了这一点(因为青少年会被父母拉入该行业);事实上,与对照组相比,实验组的青少年女孩每周工作时间减少了约 2 小时,这一差异非常显著。鉴于成年人群体有所增加,而青少年群体有所减少,因此不出所料,总体指数接近零,不具统计显著性。到基准期 2 时,由于对照组家庭已开始借款,实验组与对照组之间的差异消失。4.4 消费 表 6 给出了意向性治疗估计值,用于估算小额信贷对家庭支出的影响。 面板 A 的第 1 列和第 3 列显示,在每位成人等效人数的家庭总支出(总支出或非耐用品支出)方面,实验组家庭与对照组家庭没有显著差异。在这两种情况下,点估计值本质上都是零,因此我们可以在 5% 的置信水平下拒绝存在 Rs 的零假设。每位等效成人的总消费增加了 85 卢比,56 的非耐用品消费(约占对照组平均消费的 6%,占非耐用品消费的 4%)增加。20 因此,在 15 到 18 个月后,获得更多微额信贷似乎与消费没有任何显著增加关联。当然,这可能在一定程度上是因为借款的人数相对较少,并且对照组中的一些人从其他 MFI 借款。21 虽然平均消费和非耐用品消费没有受到显著影响,但支出结构发生了变化:第 2 列显示,实验组家庭的支出在统计上显著增加了 每人每月增加 17.08 美元 22,或 205 人21 对于总消费,对已接受治疗组的隐含治疗效果 (TOT) 或 IV 估计值为 119(10/.084),即 5% 的增幅;而非耐用品消费则为 75 (4%) 下降。不过,TOT 估算值的 90% 置信区间较宽,介于 840 卢比(或 60%)的增幅到 600 个(即 43%)。当然,TOT 置信区间的宽度源自第一阶段的低值。2290% 置信区间为 (1, 33)。 23 美元,比对照地区的家庭多支出 1, 000 美元。请注意,这可能低估了贷款对耐用品购买的总体影响,因为我们的衡量方法会漏掉在调查前一年(调查是在中心开业 15 到 18 个月后进行的)借款并立即用贷款购买耐用品的所有人。最常购买的耐用品包括黄金和白银、摩托车、纱丽(批量购买,可能主要用于婚礼或作为商家存货)、彩色电视、冰箱、人力车、计算机和手机。第 7 列和第 8 列显示,虽然非耐用品支出没有明显变化,但实验组家庭耐用品支出的增加在很大程度上被“诱惑性商品”和节日支出的减少所抵消。诱惑性商品是指基准调查中家庭表示希望减少支出在其上的商品(因此,所有家庭的商品列表都是相同的)。在本例中,这些内容包括酒精饮料、烟草、槟榔、赌博和在住宅以外的地方食用食物。诱惑性商品的支出减少了约 每人每月 9 美元(第 7 列)。我们还在第 8 列中看到,去年人均节日支出大幅下降(卢比12% 或 20% 的对照组水平,在 10% 的水平上具有显著性)。总体而言,诱惑商品和节日季的消费平均下降了 每人每月 21 美元。节日支出减少并非源自婚礼等大型、非常昂贵的仪式发生大幅变化(我们在数据中看到的此类仪式非常少),而是似乎源自节日支出在各个层面的分布出现下降。这些变化的绝对幅度相对较小:例如,印度卢比以 2007 年 PPP 汇率计算,结局点 1 时人均每月增加的耐用品支出为 17 美元。不过,与对照地区的耐用品总支出相比,这仍是一个增长约 17% 的结果。此外,此数据是针对非借款人和借款人计算的平均值,如果仅归因于借款人,则会更高。表 6 的面板 B 报告了第二次基准调查时的影响效果,此时实验组和对照组家庭均可参与微额信贷计划。对人均总支出和人均非耐用品支出(第 1 列和第 3 列)的影响均为负,t 统计量约为 1。诱惑性商品的支出仍低约 1,000 卢比。每月 10 次(第 7 列),与基准组 1 类似,但目前影响微不足道。对节日的影响现在是正面的,但不显著。在基准组 2(第 2 列)中,耐用品支出平均值也没有差异。鉴于实验组和对照组家庭在第 2 个基准期之间的主要差异在于实验组家庭的借款时间更长,这表明在第 2 个周期中,实验组家庭似乎只是用另一件耐用品(大致相同的大小)重复了第 1 个周期,而对照组家庭也获得了一件耐用品。4.5 小额信贷作为社会革命:教育、童工和女性赋权? 到目前为止的证据表明,微型金融在穷人生活中的作用与标准描述有所不同:对微型金融的积压需求并不巨大;许多家庭使用贷款购买耐用家用品,减少了可避免的消费以便偿还贷款;有些家庭会投资于自己的企业,但这并未使大多数企业的盈利能力显著增长。微额信贷文献中的另一个基本观点是,由于贷款是发放给女性的,并让她们有机会开办自己的企业,这将使家庭中的女性获得更广泛的赋权,而这种赋权反过来又会为所有人带来更好的成效,包括教育、健康等方面(例如 CGAP,2009)。事实上,我们发现在基准调查 1 结束时,由女性管理的企业数量显著增加(表 7,第 9 列)。23 为了研究女性创业人数的增加是否会提高女性的议价能力,表 7 考察了获得小额信贷对女性决策能力、儿童教育和劳动力供给的测量指标有何影响。 许多关于家庭决策的研究发现,妇女的议价能力越强,家庭在儿童人力资本方面的投资就越多(参见 Thomas,1990 年和 Duflo,2003 年)。不过,我们发现儿童或青少年入学概率没有变化(表 7,第 1、2、5 和 6 列),但青少年女孩的劳动力供给确实有所减少(表 5,第 5 列)。私立学校学费没有差异,私立学校和公立学校的入学人数也没有差异(为节省空间,未报告结果)。5 至 15 周岁女孩或男孩的工作时长也没有差异。 23 在基准调查 2 中,实验组和对照组妇女经营的企业数量没有差异,这并不令人意外,因为所有地区在那时都已可获得微额信贷。 25(第 3 列和第 4 列)。由于有许多可能的代理变量可以衡量妇女赋权,并且有许多“社会”结果,因此我们采用了 Kling 等人 (2007) 的方法,对“小额信贷对‘社会结果’没有影响”的零假设与“小额信贷可以改善社会结果”的备选假设进行了测试。我们对 16 项社会结果的 z 得分构建了等权平均值;这种方法可最大限度地提高检测社会结果影响的效力(如果存在此类影响)。24 第 7 列显示,微额信贷对社会结果指数没有影响(点估计值为 0.007 个标准差),并且我们可以以 95% 的置信度排除增加超过一个标准差的可能性。25 这表明,没有初步证据表明微额信贷会导致家庭决策或社会结果发生重大变化。此外,这似乎不仅仅是因为我们只在短期内观察到这种情况。在基准期结束时,没有出现任何重大变化:获得小额信贷对女性赋权指数的影响仍然非常小(实际上略有负面影响),并且不显著,仍然可以排除除小影响之外的其他影响。请注意,我们比较的是根据 EL2 同样有可能借款的家庭:根据 EL2,主要区别在于,实验组家庭在前 18 个月内获得了更多微型金融服务;这可能会限制在社区一级检测社会成效差异的效力。5 结论 这项研究是首次对使微型金融在全球范围内广为人知的标准小组贷款产品进行评估,也是进行时间最长的评估。研究得出了一系列结果,这些结果可能会促使人们重新思考微型金融的作用。 第一个结果是,与 MFI 和其他组织(包括我们的合作伙伴)有时声称的情况相反,微额贷款的需求远非普遍存在。在为期三年的项目实施期结束时,24 我们使用的 16 项结果包括:女性在食品、服装、健康、房屋购买和维修、教育、耐用品、黄金和白银、投资等各领域的决策指标;学费、杂费和其他教育支出的支出水平;医疗支出;青春期女孩和青春期男孩的入学人数;以及未满 1 周岁和 1 到 2 周岁女孩的人数。我们之所以选择这些结果,是因为它们可能会受到女性在家庭中的讨价能力变化的影响。2595% 置信区间为 (-.04, .05)。单位为标准差。26 年的研究期内,只有 38% 的家庭从 MFI26 借款,这些家庭是根据其相对较高的微额信贷需求而选择的。这似乎并不异常:另外两项设计类似的随机干预(在摩洛哥和墨西哥)也发现采用率相对较低,而另一项专门针对印度南部农村地区的微金融采用率开展的研究也发现采用率较低(Banerjee 等,2013)。尽管有证据表明微型企业的边际回报率很高(例如,de Mel 等人 [2008]),但大多数家庭可能没有回报率至少为 24%(Spandana 贷款的 APR)的项目,或者只是因为这些来源提供更大的灵活性,而更愿意向朋友、亲戚或放款人借款,尽管会产生利息较高(向放款人借款)或尴尬(向朋友或亲戚借款)等费用(Collins 等人 [2009])。对于选择借款的妇女,虽然小额信贷“成功”帮助其中一些人扩大了业务(或选择创办女性所有制企业),但似乎并未助力她们通过这些小型企业摆脱贫困。月度消费(衡量整体福利水平的良好指标)不会增加,无论是在短期内(我们可能预见到,随着借款人通过微额信贷购买家用或商用耐用品,消费不会增加,甚至可能会下降),还是在这些家庭获得微额信贷一段时间后(前对照组中的人应该会勒紧裤腰),长期内也是如此。虽然盈利能力较高的企业出现了显著增长,但大多数企业的利润并未增加。这项研究是在动态的城市环境中进行的,背景是极高的增长率。微额信贷似乎对此影响不大,但在其他环境中可能有不同的影响。此外,在海得拉巴德的背景下,我们发现,在短期内,获得小额信贷似乎对教育、健康或女性赋权没有明显影响。从长远来看(借款利率相同,但实验组家庭的平均借款期限更长),对妇女赋权或其他社会成效的影响仍然不大。这些结果因研究而异,但总体而言,它们并未描绘出贫困家庭基本发展成效出现显著变化的图景。26 实验组的采用率为 42%,对照组的采用率为 33%。 27 因此,小额信贷可能不是人们有时宣称的那种“奇迹”,但它确实让一些家庭能够投资于自己的小企业。原因之一可能是,鉴于创业者的技能组合和生活状况,此目标群体经营的平均企业规模很小(几乎没有员工),利润率不高,即使在高增长环境中也难以扩张。而且,受微额信贷影响而开办的边际企业的盈利能力和活力可能更低:我们发现,与对照组地区的新企业相比,微额信贷实验组地区的新企业平均更不太可能拥有员工,而且与对照组地区的新企业相比,实验组地区的新企业平均盈利能力更低。不过,小额信贷确实会影响家庭消费结构。我们发现,家庭会投资于耐用家居用品,并限制诱惑性商品的消费以及节日和派对的支出。几年后,他们仍会继续这样做,而且这种减少并非由少数特别节俭的家庭造成,而是似乎遍布整个样本。所有其他研究也发现了此类支出出现了类似的下降。因此,消费行为的改变似乎与特定 MFI 的意识形态无关。小额信贷还会影响劳动力供给选择:我们发现,能够获得贷款的家庭似乎会更努力地经营自己的企业;在其他情况下,他们会减少在其他地方从事繁重劳动。因此,在信贷和储蓄机会都有限的环境中,小额信贷发挥着金融产品的作用。它可以扩大家庭做出不同跨期选择(包括企业投资)的能力。微额信贷支持者可能犯的唯一错误是,过高估计了创业对穷人的潜力,既作为创收来源,也作为赋予女性所有者权力的手段。

响应

以下是对您关于研究论文的问题的解答:

  1. 该论文于 2014 年 3 月发布。
  2. 样本规模约为 6,850 户家庭。
  3. 研究方法为随机对照试验。印度海得拉巴德 104 个社区中有 52 个社区被随机选中,可参与 Spandana 的微额信贷计划。
  4. 本研究由 The Vanguard Charitable Endowment Program、ICICI Bank、Spandana 和 J-PAL 资助。资金并非来自商业资助者。
  5. 研究的关键问题是微型金融对家庭和企业的影响。
  6. 主要发现是,获得微额信贷不会显著增加家庭消费或导致社会成效出现重大变化。不过,这确实会导致耐用品支出增加、“诱惑性商品”支出减少,以及企业投资略有增加,尤其是利润较高的企业。
型号: gemini-1.5-flash-001
温度: 1
输出令牌数量上限: 8192
TopK: 40
TopP: 0.95