正则化

问题

什么是正则化?

回答

正则化简单地讲就是在估计值 $\hat{\beta}$ 中加多了一个限制项,得到了一个 $\hat{\beta}’$, 这样的话,在数学上可以证明:$||\hat{\beta}’|| < ||\hat{\beta}||$ 「参考测度论」,所以加入者正则项后,新的估计值 $\hat{\beta}’$ 的长度小于原来的估计值 $\hat{\beta}$,这样我们就可以避免过拟合。参考链接 @mbpRetina

线性回归多重共线性

问题

在多元线性回归中,自变量间的多重共线性问题如何判断和处理?

回答

【定义】
当自变量之间存在某种线性关系或高度相关的时候,就会发生多重共线性问题。

多重共线性问题的两种情形都会给回归模型的参数估计带来困难。完全多重共线性问题指矩阵 X’X 严格不可逆的情形,造成了模型的不可估计;近似多重共线性问题即数据矩阵中的一个或几个列向量可以近似地表达为其他列向量的线性组合的情形,会导致参数估计值的标准误过大。

【判断】
一个判断是否存在严重近似共线性问题的经验性原则是:(1)自变量中最大的方差膨胀因子 VIF 大于 10;(2)平均方差膨胀因子 VIF 明显大于 1。

【解决】
当多重共线性问题发生时,我们需要对其进行处理才能保证模型本身的有效性。

Read More

判断变形词

问题

给定两个字符串 str1 和 str2,如果 str1 和 str2 中出现的字符种类一样且每种字符出现的次数也一样,那么 str1 与 str2 互为变形词。请实现函数判断两个字符串是否互为变形词。

【举例】
str1="123",str2="231",返回 true。str1="123",str2="2331",返回 false。

回答

  1. @reynd Python3

Read More

日活与月活

问题

运营中,日活与月活的比值变化,说明了什么?

回答

作者:Aaron 余乐
链接:https://www.zhihu.com/question/24007425/answer/130382392
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

DAU(日活):单日活跃用户量,反应产品短期用户活跃度

MAU(月活):单月活跃用户量,反应产品长期用户活跃度日活和月活的比值乘以 30 等于用户月平均登录天数。

日活和月活的比值高,代表一个月有使用产品的用户中,每天都使用产品的用户比例高,即使用频率高,用户对产品的依赖性强,同时也说明用户粘度较强。另一方面,也代表了用户的流失率低,留存率高。

Read More