股票学习网

股票入门基础知识_炒股入门与技巧_怎么买股票 - 股票学习网!

双重边际效应是指(双重边际效应现象)

2023-04-21 18:44分类:炒股问题 阅读:

分享兴趣、传播快乐、增长见闻、留下美好!

亲爱的您,

这里是LearningYard学苑。

今天小编为大家带来文章:88研读分享论文7-2:精读期刊论文-《非对称信息下的供应商侵占》引言 。

欢迎您的访问!

Share interest, spread happiness, increase knowledge, leave beautiful!

Dear ones,

this is LearningYard.

Today's small series for you to bring the article:88 Reading and Sharing Paper 7-2: Intensive Reading of Journal Papers-Introduction to "Supplier Encroachment under Asymmetric Information" .

Welcome Your Visit!

 

 

 

88研读分享论文7-2:精读期刊论文-《非对称信息下的供应商侵占》引言 .mp31:22

来自LearningYard学苑

 

 

 

 

今日内容摘要Abstract:

阅读并分析来自management science期刊的英文论文《Supplier Encroachment under AsymmetricInformation》中引言的写作。

Read and analyze the writing of the introduction in the English paper "Supplier Encroachment under Asymmetric Information" from the management science journal.

正文 body part:

引言部分首先解释了供应商侵占的概念-供应商通过直销渠道入侵零售商的市场。第二段分析了供应商入侵对供应商与零售商双方的影响,首先有文献指出供应商入侵在零售商具有显著零售效率效率时会减轻供应链上的双重边际效应,并且通过一定的机制来促使零售商降低批发价格。在以往的研究中往往假设供应链上的信息具有对称性,但在在实践中,零售商往往比供应商更了解市场潜力(凭借其优秀的预测能力、一手销售信息、专业的知识)。尽管传统观念认为,零售商获得私有市场信息必然是有利的,本文的研究结果表明,当供应商开发了自己的直接渠道时,情况并非如此(图1)。

The introductory part first explains the concept of supplier encroachment - the invasion of a retailer's market by a supplier through direct sales channels. The second paragraph analyzes the impact of supplier intrusion on both suppliers and retailers. First, some literature points out that supplier intrusion will reduce the double marginal effect on the supply chain when the retailer has significant retail efficiency, and through a certain mechanism Encourage retailers to lower wholesale prices. In previous studies, it is often assumed that the information on the supply chain is symmetric, but in practice, retailers often understand market potential better than suppliers (with their excellent forecasting ability, first-hand sales information, and professional knowledge). While conventional wisdom holds that it is necessarily beneficial for retailers to have access to private market information, our findings suggest that this is not the case when suppliers develop their own direct channels (Figure 1).

图1 Figure 1

 

作者在古诺竞争模型的基础上提出供应商侵占框架,通过引入非对称信息结构,其中零售商知道市场规模的实现,而侵占供应商只知道市场大小的先验分布(图2)。由于双方无法进行可靠的信息交流,供应商依靠从零售商的订货量来分析市场规模的大小从而进行直销渠道销量的选择,零售商会为了自己的利益故意扭曲自身的订货量。在这样的情形下,双重边际效应被扩大,供应商和零售商的利益都受损,从而出现只有一方最终受益或者双输的结果,进一步丰富了2007年Arya 等学者的研究结论。

The authors propose a supplier encroachment framework on the basis of the Cournot competition model, by introducing an asymmetric information structure, in which retailers know the realization of market size, while encroaching suppliers only know the prior distribution of market size (Figure 2). Because the two sides cannot communicate reliably, suppliers rely on retailers' order quantities to analyze the size of the market to select direct sales channels. Retailers will deliberately distort their own order quantities for their own benefit. In such a situation, the double marginal effect is expanded, and the interests of both suppliers and retailers are damaged, so that only one party ultimately benefits or both loses, which further enriches the research conclusions of scholars such as Arya in 2007.

图2 Figure 2

 

文献综述单独成章(图3)。第一段讨论供应商入侵的影响:过往的文献研究得出的结论归纳为供应商侵占可能会降低经销商推销产品的动机,也会稀释品牌形象;供应商侵占可以缓解双重边缘化,从而使供应商和分销商都受益。本文的研究一定程度上补充完善上述流派的结论,研究发现在允许经销商拥有关于市场规模的私人信息时,供应商侵占有时会加剧双重边缘化,并在供应商和经销商私下了解需求时损害双方的利益。

The literature review is organized as a separate chapter (Figure 3). The first paragraph discusses the impact of supplier encroachment: past literature studies have concluded that supplier encroachment may reduce dealers’ incentives to promote products and also dilute brand image; supplier encroachment can alleviate double marginalization, thereby making Both suppliers and distributors benefit. The research of this paper complements the conclusions of the above schools to a certain extent, finding that when dealers are allowed to have private information about market size, supplier encroachment can exacerbate double marginalization and damage when suppliers and dealers privately understand demand interests of both parties.

图3 Figure 3

 

第二段分析了研究供应链上的信息共享激励的文献(图4):部分研究学者认为,如果没有特定的激励措施,分销商将保留其私人需求信息,而不是均衡地与供应商共享。一些文献考虑分销商对泄露其私人需求信息的担忧如何影响其从供应商处订购。在信息不对称和存在竞争渠道时,竞争分销商可能愿意与供应商共享其私人需求信息,这可能会降低批发价格。在一个供应商与多个经销商组成的供应链中,供应商可能泄露信息以刺激下游订单量,现有经销商可能会故意通过订购任何市场规模的相同数量来阻止信息传播。本文的研究结合已有的文献,将两个经销商渠道竞争的情况扩展到供应商直销与传统转销渠道的竞争,并得到了不同的结论-供应商侵占可能会鼓励分销商与供应商共享其私人信息。

The second paragraph analyzes the literature on information-sharing incentives in supply chains (Figure 4): some researchers argue that without specific incentives, distributors will retain their private demand information instead of sharing it with suppliers in a balanced manner. Some literature considers how distributors' concerns about disclosing their private demand information affect their ordering from suppliers. In the presence of information asymmetry and competing channels, competing distributors may be willing to share their private demand information with suppliers, which may lower wholesale prices. In a supply chain consisting of a supplier with multiple distributors, the supplier may leak information to stimulate downstream order volume, and existing distributors may deliberately block the spread of information by ordering the same quantity of any market size. Combining the existing literature, the research of this paper extends the competition of two distributor channels to the competition between supplier direct sales and traditional resale channels, and arrives at different conclusions-supplier encroachment may encourage distributors to share with suppliers its private information.

图4 Figure 4

 

第三段进一步补充说明了研究参考的重要文献(图5)。 Jiang等人的研究假设了独立销售商通过平台销售产品,平台所有者也可以获得产品,并对市场准入具有垄断控制权。独立卖家通过同样的销售努力来隐藏私人需求信息的动机可能会伤害平台所有者,但会使自己受益。此处的平台与独立销售商的行为与供应商直销渠道中的供应商与零售商相似。受该研究的启发,本文假设两家公司都可以进入市场,但供应商可以完全控制产品的进入(即经销商没有其他供应来源)。研究结果表明,没有任何汇集均衡能在直觉准则中幸存下来,而在由此产生的分离均衡中,供应商侵占可以使两家公司受益或受损。

The third paragraph further supplements the important literature referenced by the study (Fig. 5). The research by Jiang et al. assumes that independent sellers sell products through platforms, and platform owners can also obtain products and have monopoly control over market access. The motivation of independent sellers to hide private demand information through the same sales efforts can hurt platform owners but benefit themselves. Platforms and independent sellers here behave similarly to suppliers and retailers in the supplier direct sales channel. Inspired by this research, this paper assumes that both companies have access to the market, but the supplier has complete control over the entry of the product (i.e. the dealer has no other source of supply). The findings suggest that no pooling equilibria survive the intuition criterion, and that in the resulting segregating equilibria, supplier encroachment can benefit or hurt both firms.

图5 Figure 5

 

今天的分享就到这里啦!

如果您对今天的文章有独特的想法,

欢迎给我们留言,

让我们相约明天,

祝您今天过得开心快乐!

That's enough sharing for today!

If you have a unique idea for today's article,

please leave us a message,

let's make an appointment for tomorrow,

have a great day!

 

感兴趣的同学可以留言与小编交流,

咱们下周见!

The students who are interested can leave a message and exchange with the small editor,

I'll see you next week!

 

参考文献:

Supplier Encroachment Under Asymmetric Information[J]. Management Science,2014,60(2):449-462.

英文翻译:Google翻译。

本文由LearningYard学苑原创,部分资料、图片来源于网络,如有侵权请联系。

编辑导语:因果推断对于解决业务分析难题十分重要,但是不同场景应选择什么方法还是较为复杂,本篇文章作者分享了不同场景下适用的因果推断解决方法,并且用通俗易懂的语言解释其原理与案例,干货满满,感兴趣的一起来学习一下吧。

一、背景

目前我们能看到因果推断相关的资料更多的聚焦在逻辑方法本身,公式非常繁杂导致较难理解与应用。

有的时候虽然看似理解了一些,但是真正应用的时候还是不太清楚什么场景应该选择什么方法。

基于此种背景,笔者梳理一些目前业界的通用业务问题场景,按照不同分析场景类型分为四大类,分别对应不同的适用因果推断解决方法,并辅以通俗易懂的语言去解释其原理与案例。

当遇到某类问题的时候,我们能快速明确的知道用什么方法可解此类问题。

二、四类分析场景与对应解决方法概览

三、分析场景与适用方法

1. 场景一:非实验场景策略效果评估

策略、功能以及活动的效果评估,几乎是每个产品、运营、分析师日常工作的一大重点。

大到重要功能上线,小到一个文案修改,都可以去衡量这个策略的效果,比之前提升了多少,对整体数据贡献了多少。

不仅衡量了工作产出,也为之后的优化方向提供沉淀与依据。AB实验是回答这个问题的最优解,但是当无法做实验时,研究如何利用历史数据进行因果分析评估也变的非常重要。

非实验场景的策略评估方式的核心思想就是:人为创造一个虚拟对照组与策略上线数据做比较估计策略真实效果

效果回归本质上属于统计学中的因果推断问题。在统计科学中,因果推断要解决的问题本质是剥离我们所不关心的外部变量对结果的影响,从而精准估计到我们所关心的策略因素对结果的单一影响。在不能做AB实验的场景下,通常有两种完成这件事情的思路:

  1. 构造相似群体(Matching):这种思路假设在未被实验策略影响的样本中存在一些样本和被实验策略影响的样本存在同质性。只要我们想办法找到这些相似的样本作为虚拟对照组,就可以控制外生因素。这种思想最经典的方法是PSM(倾向得分匹配法);
  2. 构造虚拟现实(Synthetic Control):这种思路认为策略的影响其实是策略上了之后的指标表现和“假设策略没上”的平行时空中指标表现的diff。因此,只要通过建模方法构建出假设策略没上的虚拟时空的指标水平,即可评估实验策略收益。典型的方法包括合成控制法、Causal Impact等;

1)PSM

PSM的思路是对策略命中的每一个用户,都在策略未命中用户中找到和他近似的一个用户

通过这种方式,策略命中用户和近似找到的对照用户就有了可比性。

PSM 作为一种 matching 方法,最大的目的就是控制实验组和控制组的观测变量。

举个简单例子,我们想对比吸烟的人和不吸烟的人的健康状况,我们观察了两组人群作为样本,可能会出现以下两种情况:

  • 恰好我们选取的吸烟的人群更年轻,身体本身就更健康,而不吸烟的人群整体年龄偏大,或者身体本身比较虚弱,最后观察一段时间得出吸烟无害的结论。
  • 吸烟的人群也喜欢喝酒,吸烟的人群本身也不注重自己的健康等等一系列其他因素干扰,导致得出吸烟有害健康的结论。

这两种结论都是不够科学的,因此用 matching 的思路可以缓解上面的情况,而 PSM是 matching 最常用的方法。具体应用可以分为以下几个步骤:

(1)计算未被策略影响的每个用户倾向性得分:这一步本质是建模问题,因变量为是否被干预Treatment,自变量为用户特征变量。做一个建模预测策略发生概率(逻辑回归/XGB/RF等);得分

(2)匹配:有了每个用户的倾向性得分,针对目前的被策略命中的用户,匹配得到一个近似相同的用户,组成对照组。

(3)修剪:筛选掉倾向性得分极值。常见的做法是保留得分在某个区间的用户,例如实验组和对照组用户得分区间的交集,只保留区间中部的 90% ,可能原始得分在0.05-0.95的用户。

(4)匹配:实验组对对照组根据得分进行匹配的时候,比较常见的有几种方法。knn: 进行 1 对 K 有放回或无放回匹配。radius: 对每个策略影响用户,匹配上所有得分差异小于指定 radius 的用户

(5)设置得分差异上限:匹配用户的时候,要求每一对用户的得分差异不超过指定的上限min(delta(score))<caliper。

(6)平衡性检验:看倾向性得分在匹配前后的分布、以及特征在匹配前后的 QQ-Plot。匹配后的实验组和对照组的倾向性得分分布更加接近,变量分布也更接近。

(7)因果效应估计(策略效果):我们的目标是推断策略组用户的平均处理效应 ATT (Average Treatment Effect on the Treated)。现在我们已经构造出了一对接近同质的实验组和对照组了,我们可以直接比较匹配后的实验组和对照组。

举个例子,业务在上线‘主播连麦PK功能’后,发现使用连麦PK功能的用户比未使用此功能的用户开播率高4.3%,于是认为该功能提高了主播开播率。这个场景该如何做效果评估?

2)特征选取

自变量:用户基础画像、行为特征;

因变量:是否使用该功能;

按照1:1的匹配比例,最终匹配上26w对用户数据。其中策略组用户开播率13.1%,对照组为11.2%,两组diff为1.9%,假设检验通过。因此从数据角度证明该功能确实能提高开播率,但提升效果为1.9%而不是4.3%。

3)SCM(合成控制法)

当treatment施加到一个群体或者地区上时,很难找到单一的对照组,这时可以采用合成控制方法构造虚拟对照组进行比较。

原理是构造虚拟对照组,通过treatment前的数据上学习的权重,拟合实验组在实验开始前的数据,模拟实验组用户在没有接受实验情况下的结果,构造合成控制组,实验开始后,评估实验组和合成控制组之间的差异。

假设我们想要衡量疫情对于上北京某类商品的GMV的影响。若按照传统的matching方法,我们需要选择一个和北京疫情前的dau、gmv等最相似的非疫情城市作对比。

但用合成控制法的话,我们需要从全国所有的非疫情城市中进行筛选,用同样的疫情前一段时间的各类维度数据与北京进行拟合匹配,使得合成后的「虚拟北京」在各个维度上尽可能真的接近「真北京」。

最终选取拟合效果好的:北京=0.1城市A+0.2城市B+0.3城市C+P ;

概括的说,我们要找到策略干预单元在不被策略干预情况下的反事实时间序列曲线:

在合成控制中,我们没有很多样本但是我们有很多时间点信息。

所以我们可以做回归拟合,将每个数据点翻转输入矩阵,然后样本会成为变量,我们将结果表示为样本的加权平均值,就像下面的矩阵乘法:北京=0.1上海+0.2天津+0.3广州。

我们尝试评估疫情对北京的某品类GMV影响,我们为其找了其他30个非疫情城市。

现在,我们可以将因变量定义为北京GMV,将自变量定义为其他城市GMV进行回归

注意几个点,首先策略干预后,合成控制的虚拟北京GMV超过了真实北京GMV,这表明疫情降低了北京的销售数据。

其次,疫情前的时期是完美拟合的,这表明我们的合成控制可能发生过拟合。因为我们的对照组用了30个城市,所以我们的线性回归模型有30个参数可以使用,这给模型提供了过多灵活性,产生过拟合风险。此时可以使用Ridge或者Lasso回归来解决此问题,这里不过多赘述。

有了合成控制的虚拟北京后,我们就可以将策略效果估计为策略结果与合成控制结果之间的差距,即 真北京-虚拟北京:

由于合成控制法的样本量通常较小,因此在确定我们的结果是否具有统计学意义时,可以使用cross validation交叉检验方法。

每次我们置换我们的策略组和对照组,由于我们只要一个策略城市,这意味着对于每个城市,我们要假装它是被疫情影响过的,其他则是对照。

通过对所有城市应用合成控制,我们可以估计所有城市的合成状态和真实状态之间的差距。对于北京来说,这就是策略效果。

对于其他非疫情城市,这就像安慰剂效应。如果将所有安慰剂效应与北京的疫情干预效果一起绘制,根据所有城市策略干预效果的分布,我们可以计算北京效应量的p值。

在我们估算的所有其他30种安慰剂效应中,没有一个高于北京的效应量,所以p值为非常接近于0,具有统计显著意义。

2. 场景二:实验场景下的正向用户下探

在做策略时,我们需要探究策略对于不同用户的异质性影响(HTE),哪些用户对策略更敏感更容易被影响以及影响有多少,更好的归因和理解不同的用户群。

通常情况下,我们结合实验来做分析。比如在实验中,我们需要挑选出来那些实验效果显著的用户,去分析他们的特征,以及找到敏感用户,帮助我们了解策略的影响,作出下一步迭代

针对这类问题,之前常用的方法是去针对用户做维度下钻,但是效率极低且并不自动化很难遍历所有特征组合去分析。

1)Causal Tree基本原理

这时我们可以结合机器学习的方法去解决此类问题,这里选择因果决策树(Causal Tree)方法。

Causal Tree是一种直接对目标进行建模的方式,它改进了传统决策树的优化目标和指标分桶方式,以达到最大化分桶的异质性因果效应,同时调整误差的效果。

首先,它会把数据分成训练集和估计集,一部分训练集去构造树,另一部分估计集去估计因果效应和方差。

其次,在树的分区方式上,使用各个节点的方差对目标函数加以修正。给定训练集Str= {(Xi,Di,Yi)},其中Di=1代表实验组,Di=0代表对照组,目标是预测E( (Yi(1) – Yi(0)) | Xi)。其中

本种方法须满足条件独立假设(CIA)即给定特征,用户是否在处理组和我们关心的结果是互相独立的。

本模型的结果易于理解,可以得到某一个叶子(用户群)的因果效应结果,但是如果需要处理高维变量的话能力相对较差,最终分桶效果可能相对较,且无法检验,所需要模型使用者真正了解问题和数据的产生过程。

在实际应用时,ab实验分析通常是满足CIA的,且一般不需要处理过于高维变量,所以本方法在实验异质性因果效应探究问题应用较为广泛。

2)Causal Tree

某业务做了产品优化实验,但实验各项消费数据表现较差,以APP平均使用时长为例,我们能否用Casual Tree找出一些群体的消费者,使得我们在这些消费者身上有正向实验收益?

特征选取:

  • 自变量:性别、年龄、新老用户、是否安装竞品、是否是创作者;
  • 因变量:实验后两周每日APP平均时长(取log)。

通过建模,我们发现Causal Tree的第一个分裂点是用户是否是创作者,说明创作者受到了更大的实验负向影响。

最终树将用户分为了10个节点(10个桶),负向因果效应最大的组为第10组(非创作者+未安装竞品+0-23岁),APP平均时长降低了16%。

负向因果效应最小的组为第4组(创作者+未安装竞品+0-12岁),APP平均时长上涨了7%;

我们将每个组的分群因果效应均画出,没有找到正向收益置信的用户组。但是有些用户群体,实验没有对他们造成很大的负向影响。

3. 场景三:策略敏感人群探究

目前业界流量竞争已经进入白热化,个性化策略已经渗透到了生活中的方方面面,不论是识别营销敏感人群去推送刺激其消费的优惠券,还是为某类视频爱好者针对性推送其所爱的垂类内容。

而如何找到真正的策略敏感人群,将更多的预算/资源投入到可以带来‘增量’的用户上,以提升整体roi,成为了后时代精细化运营的关键,Uplift Model可以尝试解决这一类问题。

1)Uplift Model基本原理

用简单的例子来介绍此模型,假设我们是个电商平台,一件标价300元的商品,用户的购买率为6%。现有一批预算可以给用户发放10元的优惠券以提升用户购买率,那么这批优惠券应该发送给平台的哪些用户呢?

此时我们脑海中有四类用户:

  1. Persuadables:不发送优惠券则不买,发送优惠券则购买;
  2. Sure things:不论是否发送优惠券均会购买;
  3. Lost causes:不论是否发送优惠券均不会购买;
  4. Sleeping Dogs:不发送优惠券会购买,发送优惠券反而不买。

左上的Persuadables(说服型)类用户被发券干预后购买率得以提升,是我们真正想要进行干预的营销敏感用户。

Uplift模型要解决的问题就是通过建模预测的方法精准的去对这四类用户进行分群

对于单个用户来说,无法同时观测到在有干预和没有干预两种情况下的表现,这也是因果推断中的反事实的问题。

这时可以从用户的角度来对平均因果效应做估计,假如我们有两组同质用户,对其中一组用户发券另外一组不发券。

之后统计这两群人在购买转化率上的差值就可以被近似认为是平均因果效应。

Uplift建模需要服从CIA条件独立假设,因为样本在特征上分布需要较为一致,因此AB实验是Uplift Model建模过程中非常重要的前置条件。

  • 首先,我们选取部分用户(小流量实验,样本量足够建模)随机分为实验组和对照组,对照组不发优惠券,实验组发放优惠券,用户最终是否购买为一个0-1变量;
  • 然后,对整体实验数据用户购买行为进行建模;
  • 最后,再用小流量实验训练得到模型对我们需要预测的全量用户进行条件平均处理效应估计,预测其发放优惠券所带来的增益值;

假设有N个用户,用户i在没有优惠券的购买结果为Yi(0),在有优惠券时购买结果为Yi(1),此时发送优惠券对该用户的增益就是uplift score (i)=Yi(1)-Yi(0)。

当uplift score为正值时,说明干预项对用户有正向增益作用,也就是上文所提到的Persuadables(说服型)用户。

此外,Uplift模型通常有几种建模方式:S-Learner、T-Learner、Class Transformation等等。

模型评估方法有Uplift柱状图、QINI曲线等方式。针对几种建模及评估方式可详细参考该把优惠券发送给哪些用户?一文读懂Uplift模型。

最后,我们总结一下Uplift模型可能的应用场景:

  • 精准定位策略敏感人群:我们希望找出来一些对干预项(例如发券、投放、内容推荐等)比较敏感的用户,继而对其进行精准策略/营销;
  • 测算收益空间:Uplift模型可以帮助我们测算如果对策略做一些人群向优化,业务收益将会提升多少;

2)Uplift Model

例如我们做了短剧类视频屏蔽Holdout实验,整体大盘DAU下降-0.5%,但大盘用户结构却未看清哪些用户是短剧核心用户,哪些用户的短剧类视频推荐分发的提升空间比较大,我们需要对大盘用户进行分层。

特征选取:

  • 自变量:用户基础画像、行为特征、整体视频消费行为、短剧消费行为、短剧内容偏好等;
  • 因变量:用户是否是短剧核心用户会反映在短剧屏蔽前后的活跃度变化上,因此需要用活跃度这个指标来定义用户正负样本。正样本:策略上线后一个时间周期 相比策略上线前一个时间周期,活跃天数差值>0,负样本反之;

训练好模型后我们对大盘所有用户进行短剧增益预测,得出了每个用户的基于短剧分发的策略增益分数Uplift Score,然后对其进行分桶观测:

4. 场景四:因果影响指标分析

很多时候因果推断会遇到混淆变量的问题,比如我们想要去分析直播推荐多样性(指标D)对用户活跃度(指标Y)的影响,但此时存在很多变量X既与D相关又与Y相关。

解决这类问题传统的方法是用X对Y做线性回归,X的参数就是影响效应,或者是上XGboost看Shap值等。

但传统的方法会依赖很多强假设例如不能多重共线性等,强假设下得到的估计不一定合理。

所以这种场景下传统的指标影响分析方法将不满足业务需求,双重机器学习(Double Machine Learning)为这个问题提供了解决的思路。

1)Double Machine Learning基本原理

在介绍DML之前我们先用最简单的例子来讲讲它所解决的问题:我们要估计冰淇淋价格与其销量间的因果效应。

我们的数据集中特征X包括温度、成本和一周中的周几三个变量,Treatment T为价格,outcome Y为销售量。

其中,T影响Y,X影响T和Y,即存在混淆。通过可视化,我们可以很明显看到,在周末(weekday=1和7)的时候,价格比平常要高很多,即星期几这个特征就是价格与销量之间的混淆变量。

一种简单的去偏方法就是线性回归,我们拟合一个线性回归模型,然后固定其他变量不变,去估计平均因果效应(ATE):

但特征X与Y的关系可能是非线性的,如温度temp,当温度升高时,人们可能都去沙滩玩耍,买冰淇淋吃,销量Y升高,但当温度过高时,人们可能只想呆在家,这时销量Y就下降了。

因此,我们不可以直接做线性回归,而需要用残差建模的方式去建立因果模型,残差的思想就是DML的理论基础。

DML是一种处理基于观测数据进行因果建模的方法,它可以去除偏差。根据Frisch-Waugh-Lovell定理,假设我们要估计Y = β·X+ θ·D+ E 中D的系数θ项:

  • 先直接用X对Y做回归,得到X估计Y得到的残差,即剔除控制量X对Y的影响;
  • 再用X对D做回归,得到X估计D得到的残差,即剔除控制变量X对D的影响;
  • 最后用上面D的残差对Y的残差做回归,就可以得到最终想估计的系数θ项,也就是ATE(D对Y的因果效应参数);

虽然DML可以去混淆,让我们可以只关注T对Y的影响。但是在T和Y残差化后,我们仍然使用的是线性模型。

当价格只需在小范围内变化时,这种方法可能还适用。

然而通常情况是,在价格较低的时候,价格增加1元,需求量可能减少2个,而在价格较高的时候,价格增加1元,需求量可能只减少1个,边际效应会逐渐递减

显然,这是一种非线性关系。这时,我们可以通过对目标函数进行转换,实现非线性建模。

在非线性CATE估计时,DML估计的是CATE的局部线性近似(导数)。

举个例子,假设我们通过模型对一个顾客估计出CATE=2,说明价格减少一个单位,销量会多出2个单位。

但我们不能据此就做出决策直接在价格上减少10个单位。因为当价格过低时,CATE可能就就会从2变成0.5。因此在处理非线性的CATE的时候,需要注意不同Treatment下的CATE可能是不同的。

双重机器学习假设所有混淆变量(既影响D又影响Y的变量)都可以被观测,所以在做特征选择时要格外注意尽量将这些特征加入模型。

同时,机器学习自带的正则化可以达到高维变量选择的效果,我们可以通过拆分训练集和测试集的方式来解决过拟合带来的偏差,提高估计准确性。

2)Double Machine Learning

用户APP消费时长一直是优化视频推荐的主要目标,但随着消费需求的多样化,优化用户时长对用户活跃度的边际效应逐渐递减。

目标:

  • 我们需要探索还有哪些潜在的用户行为或者哪些内容对用户活跃度有正向因果影响;
  • 这些潜在抓手的因果效应都是多少,以判断其优先级;

由于用户活跃度和非常多指标都存在相关性(混淆变量较多),因此不能直接回归,需要用DML来计算潜在抓手指标对用户活跃度的因果效应,比较因果效应大小来判断优先级;

特征选取:

  • X:统计第一个时间周期的用户消费行为特征(习惯偏好、消费行为、互动行为、消费内容垂类、作者相关画像信息等)
  • D:统计第二个时间周期的用户消费应为特征(D为需要计算因果效应的特征)
  • Y:第三个周期的用户活跃天数

建模步骤:

随机选取第二个时间周期的活跃用户,拆分训练集和测试集,关联第一个时间周期的特征指标及第三个时间周期的因变量;

  1. 用训练集数据,用XGB将X对Y做回归,在测试集上得到X对Y的残差,这步可以剔除控制变量X对Y的影响;
  2. 用训练集数据,用XGB将X对D做回归,在测试集上得到X对D的残差,这步可以剔除控制变量X对D的影响;
  3. 用测试集数据,对每个待评估指标D,用线性回归模型拟合上面的D残差~Y残差,得到每个D特征的因果效应系数θ,θ表示D指标每增加1%,用户的周活跃度将提升θ%;

剔除不显著的特征,整体来看按照提升用户活跃情况的边际效应大小的逻辑来确认优化手段的优先级,优化内容的分发垂类结构>提升用户的内容互动量>优化内容生产者结构。

#专栏作家#

赵小洛,公众号:赵小洛洛洛,人人都是产品经理专栏作家。数据分析师一枚。

本文原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自Unsplash,基于CC0协议。

广发证券首席经济学家 郭磊

报告摘要

第一,在10月21日《郭磊:对当前经济和资产的认识——在WIND秋季策略会上的分享》中,我们指出宏观面仍存在四个不确定性;但一些主要线索已现拐点或处于经验上的极值位置,逻辑改善的空间大于逻辑恶化的空间。当时我们结论是“权益资产角度处于胜率线索并不清晰,演进路径尚待观察;但赔率已经比较有利,价值相对凸显的位置。特别对长期投资者来说,我们倾向于认为在姿态上应逐步积极”。11月以来,上述结论得到初步印证。同时一些新的宏观线索也在形成,宏观面进一步出现三个边际变化。

第二,边际变化之一是美国通胀放缓斜率超预期,加息焦虑阶段性缓解。10年期美债收益率中枢下移推动全球流动性改善,美元下行亦附加释放非美市场的资产估值压力,短期形成双逻辑驱动。

第三,边际变化之二是地产供给端纾困政策升温,“第二支箭”有助于缓解民营房企的融资问题,修复信用环境、改善金融市场预期。金融支持房地产平稳健康发展的其他举措也在快速推进。

第四,边际变化是三是优化疫情防控20条措施出台,它将提升防控精准性、科学性,从而有助于消费服务业环境的改善及物流供应链的稳定。

第五,变化一缓和全球流动性压力;变化二降低资产负债表风险;变化三改善增长条件。就我们前述框架来说,以上三个变化的主要影响是短期进一步提高了权益资产的“胜率”。

第六,同时需要指出的是,疫情仍在上行过程中,它对居民生活半径仍可能会存在自然约束;出口在继续放缓;从10月偏低的社融数据看,疫情和地产对融资需求仍存较明显约束。增长中枢的抬升仍有赖于“扩大内需战略”的进一步落地,如政策所指出的, “实施扩大内需战略是应对外部冲击、稳定经济运行的有效途径”。

第七,简言之,三个边际变化改善的主要影响市场预期和风险偏好,经济增长和企业盈利的实质改善仍有待于政策线索的继续浮现,12月的中央经济工作会议是一个重要时间窗口。

正文

在10月21日报告中,我们指出宏观面仍存在四个不确定性;但一些主要线索已现拐点或处于经验上的极值位置,逻辑改善的空间大于逻辑恶化的空间。当时我们结论是“权益资产角度处于胜率线索并不清晰,演进路径尚待观察;但赔率已经比较有利,价值相对凸显的位置。特别对长期投资者来说,我们倾向于认为在姿态上应逐步积极”。

11月以来,上述结论得到初步印证。同时一些新的宏观线索也在出现,宏观面出现三个边际变化。

在10月21日报告《当前宏观面与资产定价》中,我们指出:

站在“确定性”的视角来看,主要的宏观线索在节奏和时间线上仍存在较明显的不确定性,未来如何演进仍需进一步观察:第一,目前博弈美联储加息结束尚为时过早;第二,欧洲能源缺口如何演变目前无法做出确定性判断;第三,国内经济在环比企稳改善的过程中,但增长中枢的显著抬升需要新的条件出现,这一点暂时没有时间表;第四,对于中期的增长目标来说,固定资产投资的再均衡是一个关键线索,政策框架有待于进一步浮出水面。

同时,一些主要线索已出现拐点或者处于经验上的极值位置,未来逻辑改善的空间远大于逻辑恶化的空间。第一,美国CPI通胀同比高点已初步确认,即升温期的冲击已经过去;第二,国内经济已经度过相对压力最大的阶段;第三,9月末地产政策出现一轮显著升温,社融也已显著扩张,地产领域进一步变差的概率较低;第四,人民币汇率短期压力已得到一轮释放,未来继续贬值空间有限;第五,目前资产定价对经济压力的反映已经比较充分。

边际变化一:美国通胀放缓斜率超预期,加息焦虑阶段性缓解。10年期美债收益率中枢下移推动全球流动性改善,美元下行亦附加释放非美市场的资产估值压力,短期形成双逻辑驱动。

美国10月通胀数据超预期回落。CPI同比增 7.7%,低于前值的 8.2%和市场预期的7.9%。10月核心CPI同比增 6.3%,低于前值的6.6%和市场预期的6.5%。

在报告《美国通胀放缓,美债和美元双逻辑缓和风险资产压力》中,我们详细分析了这一数据的影响:这一数据将缓解通胀预期和加息焦虑。数据公布后,Fed Watch数据显示的12月美联储加息50bp的概率从11/9日的56.8%上行至85.4%。期货市场隐含联邦基金利率终端从11/9日的5.04%回落至4.89%。三大股指强势反弹,美债收益率大幅下行、美元指数回落。从资产定价逻辑来说,美债收益率是全球无风险收益率的锚之一,它的下行有助于全球长久期资产的估值修复。同时,美元和非美汇率之间的跷跷板关系影响全球流动性的边际变化方向,美元下行也会附加释放非美市场的资产估值压力。这两个逻辑对国内权益资产定价来说都是积极信号。

边际变化二:地产供给端纾困政策升温,“第二支箭”有助于缓解民营房企的融资问题,修复信用环境、改善金融市场预期。金融支持房地产平稳健康发展的其他举措也在快速推进。

在报告《“第二支箭”延期并扩容的影响》中,我们详细分析了这一事件的影响:11月8日,中国银行间交易商协会宣布将继续推进并扩大民营企业债券融资支持工具(“第二支箭”),支持包括房地产企业在内的民营企业发债融资。由于其他行业的民企违约率并不算高,这次的主要意义之一就是缓解民营房企的融资问题。“第二支箭”是融资端纾困政策的加码,有利于提高房企债券融资的效率与规模。本轮需求刺激政策之所以对地产销售端的作用不显著,一个重要的原因是地产信用风险事件多发环境下,房企大部分倾向于降价销售尽快回笼现金流,这一特征进一步影响了居民的房价预期与购房意愿。在“第二支箭”与其他地产纾困政策的叠加下,地产信用风险得到有效缓解,则地产销售亦能得到更好的提振。

边际变化三:优化疫情防控20条措施出台,它将提升防控精准性、科学性,从而有助于消费服务业环境的改善及物流供应链的稳定。

中共中央政治局常务委员会11月10日召开会议,听取新冠肺炎疫情防控工作汇报,研究部署进一步优化防控工作的二十条措施。

11月11日,国务院联防联控机制发布了《关于进一步优化新冠肺炎疫情防控措施 科学精准做好防控工作的通知》。

变化一缓和全球流动性压力;变化二降低资产负债表风险;变化三改善增长条件。就我们前述框架来说,以上三个变化的主要影响是短期进一步提高了权益资产的“胜率”。

2021年底10年期美债收益率为1.5%,美元指数为96.0;2022年11月7日二者分别上行至4.2%、110.2。美债收益率的上行对应全球流动性收敛;美元指数上行导致非美市场流动性收敛更为明显。短期美债收益率和美元指数上行压力的缓和带来全球流动性压力缓和。

2022年地产销售和投资深度下行,前三季度地产销售累计同比增长-22.2%;新开工累计同比增长-38.0%,投资完成额累计同比增-8.0%,基本面下行背景下融资需求上升,但资产质量下降导致融资困难,行业在一定程度上存在信用风险;针对供给端纾困政策的推进有利于风险的缓释。

从2022年的经济驱动要素来看,主要拉动因素是出口、基建;主要拖累因素是消费、地产。2022年三季度社会消费品零售总额同比增长3.5%;批发零售、住宿餐饮、房地产GDP同比分别为1.6%、2.8%、-4.2%。广义消费主要受居民生活半径影响,疫情防控措施的优化将带来积极影响。

同时需要指出的是,疫情仍在上行过程中,它对居民生活半径仍可能会存在自然约束;出口在继续放缓;从10月偏低的社融数据看,疫情和地产对融资需求仍存较明显约束。增长中枢的抬升仍有赖于“扩大内需战略”的进一步落地,如政策所指出的, “实施扩大内需战略是应对外部冲击、稳定经济运行的有效途径”。简言之,三个边际变化改善的主要影响市场预期和风险偏好,经济增长和企业盈利的实质改善仍有待于政策线索的继续浮现,12月的中央经济工作会议是一个重要时间窗口。

核心假设风险:宏观经济变化超预期,外部环境变化超预期。

本文源自券商研报精选

为什么年轻人热衷逛HARMAY话梅?“大肚水杯”凭什么征服职场打工人?初冬大热的“中国式浪漫”——围炉煮茶,到底有何魅力?

消费增长研究院发布的《2023中国消费市场潜藏价值研究报告》揭示了上述现象火爆的背后答案——边际效应与情绪价值积木式的叠加。在值得买科技集团副总裁、消费增长研究院专家顾问赵一鹤看来,这将导致大量场景创新机会涌现。

18岁至35岁人群成为新一代消费主力

影响消费行为变化的是人。

2021年5月11日,国家统计局公布的第七次全国人口普查结果显示,目前,我国总人口为141178万人。其中,18岁至35岁人口规模约为49438万人,占总人口的35.35%。

来自BCG和阿里研究院的研究报告显示,2021年,中国年轻一代(18岁至35岁)消费额已赶超上一代(35岁以上),达2.6万亿美元。

赵一鹤表示,由此可见,年轻一代正在成为中国消费市场的主力人群。“中国消费话语权已成功完成向年轻一代的过渡与交移。人口代际更迭所产生的消费观念与行为的变化,将进一步向各行业领域加速渗透,带来消费市场的增长新机遇。”

下面一组数据也佐证了上述观点。

魔镜《2022年“双11”大促全面复盘报告》显示,2022年“双11”,在天猫食品饮料大类目销售额同比下降5.5%的情况下,只有两个次级类目维持了增长,一个是米面粮油,一个是酒。除此之外,能够为消费者带来美好情绪感受的消费品类也实现了同步增长,比如,以露营、飞盘为代表的运动户外品类,以及“陪伴经济”下的宠物品类,消费热度依然不减。

这一现象被赵一鹤解读为,消费者只买两种东西,即最便宜的必需品和体验最好的消费品。他认为,这种消费行为背后,是代际更迭产生的消费观念的变化。

“理性边际人”拓宽消费场景边界

“如果60元的薏仁水用起来比600多元的神仙水舒服,那就用呗,适合自己最重要。”“对我来说,在可支付的范围内,我会选择体验更好、使用感更佳的产品,这种精神和感受上的满足没必要妥协。”在谈到自己的消费观时,一位来自北京的28岁女性消费者和来自上海的32岁男性消费者如是说。

在赵一鹤看来,年轻一代正在成为中国消费市场的主力人群,在信息高速流动时代成长起来的年轻消费者,比以往任何一代都更加理性。“这是因为,商业社会底层设施的成熟,为产品的易得性提供了极大的便利,‘买买买’的炫耀性消费,已经不再是年轻一代消费者的首要目标。相反,回归真实需要,理性‘剁手’、精细测评、细腻感受,正在成为当下消费者购买决策的重要评判标准。这种理性为先、感受至上的消费观念,进一步拓宽了消费场景边界。对他们而言,只要力所能及,能够带来美好感受的产品与服务,都可划入消费购买清单范围。因此,我们能够看到,极致精明与极度任性,在年轻一代消费者身上获得了很好的兼容与平衡。”

他认为,其中最重要的决策杠杆,就是“边际增量”。如何买得更值、更符合自己的真实需要,让花出去的每一分钱都能带来最大的“边际效用”,正在成为新一代“理性边际人”的消费新逻辑。

“理性边际人”催生出了不少场景创新机会。赵一鹤认为,场景创新由最低成本、最高效率和最好体验构成。

以HARMAY话梅为例。它是一家拥有仓储式美学基因的新零售品牌,以“大牌旅行装”的商业模式与高度秩序感的“仓储美学”成为年轻一代美妆消费的热门打卡地。赵一鹤认为,HARMAY话梅的商业创新,来自对“边际增量”的敏锐捕捉。“我们都知道,越是国际知名的美妆品牌,正装价格越高。对于理性、精明的年轻消费者而言,直接购买正装产品,意味着更高的决策成本与试错风险。旅行装恰好解决了高端大牌低成本试用的需求痛点,让消费者在力所能及的范围内,最大化享有美妆大牌的极致体验。两年时间,HARMAY话梅快速完成了四轮融资,在全国九个城市拥有13家门店,平均坪效达到每平方米3000元至4000元。初次到店的购买率接近50%,初次购买率和复购率达到同行水平的两倍。”他表示,HARMAY话梅为线下消费场景创新提供了新范式——以更低的交易成本,为消费者带来美好生活的获得感。

“类似的场景创新案例还有很多。”赵一鹤表示,比如近两年在职场打工人圈层中大火的“大肚水杯”,通过大容量杯身、清晰的刻度和元气满满的能量语,成为年轻一代的OFFlCE硬核装备。“对于消费者而言,‘大肚水杯’提供的边际效益不是喝水,而是元气满满的办公能量,即以最小的时间成本,最大化获得健康身体与心理感受的‘边际增量’。通过硬核参数与情绪价值,给予打工人身心即刻焕活的支持感。”

同样,围炉煮茶也遵循着“边际增量”的场景创新逻辑,为线下小酒馆、小茶馆和近郊民宿带来了新的生机。“相比高级酒店的下午茶,围炉煮茶的交易成本更低,体验效果更好,氛围力足,出片率高。”赵一鹤说。

“未来,伴随着边际效应与情绪价值积木式的叠加,将涌现大量的场景创新机会。”赵一鹤认为,一方面,疫情之后,消费流动性增强,空间场景边界会进一步拓宽;另一方面,年轻一代主流消费群体的理性边际观念与情绪代偿、安放需求,会在周期内持续增长。企业需要基于自身的产品与服务,挖掘消费者的“边际价值”。与此同时,通过情境设计,在消费者的日常生活场景中,为产品与服务找到“近场优势”,识别高感性的情绪隐喻,找到情绪线索的“进场路径”。

人口的代际变化会带来新的消费观念、新的消费习惯与新的消费场景,而这种供给、需求和连接的变化,一定会为中国消费市场带来新空间、新价值和新增量。

文|本报记者 王 洋

https://www.haomiwo.com

上一篇:人脑芯片概念股(数字经济概念股龙头)

下一篇:dde指标是什么(dde指标详解)

相关推荐

返回顶部