首页 | 分类 | 标签 | 每日一题 | 关于 |
|
问题相关系数的大小与相关系数的显著性水平是什么关系?如何解释? 回答 两连续变量:Pearson 相关;两等级变量:Sperarman 相关;一列为连续变量,一
问题线性回归有什么假设? 回答 古典线性模型需要 7 条假定(ucb 的 Bickle 一本书,想不起名字了居然…),如果假定不满足,一条一条的修正就慢慢演化到
问题什么是正则化? 回答正则化简单地讲就是在估计值 ˆβ 中加多了一个限制项,得到了一个 ˆβ′, 这样的话,在数学
问题如何估算武汉肺炎全国受感染人数? 回答 我觉得三大运营商可以很方便统计,支付宝还可能有偏 @m1kufan 定位号码在医院的非常驻人员?( @wweiyan
问题制作词云有什么简单易的方法或工具? 回答 wordcloud2 tableau finebi 也行@wweiyan mathematica 也行( @clo
问题在多元线性回归中,自变量间的多重共线性问题如何判断和处理? 回答【定义】当自变量之间存在某种线性关系或高度相关的时候,就会发生多重共线性问题。 多重共线性问
问题为什么说随机森林比决策树拥有更好的泛化能力? 回答随机森林拥有投票机制,减少单棵树出现的偏向问题决策树单一决策 容易过拟合 @wweiyan
问题在不同的数据分析软件/语言中,选(select)取或切片(slice)有什么技巧?请畅所欲言~ 回答暂无,前往 Telegram 群 参与答题。不积跬步无以
问题给定两个字符串 str1 和 str2,如果 str1 和 str2 中出现的字符种类一样且每种字符出现的次数也一样,那么 str1 与 str2 互为变形
问题运营中,日活与月活的比值变化,说明了什么? 回答作者:Aaron 余乐链接:https://www.zhihu.com/question/24007425/
问题对数据分析相关技能,你最推荐的学习材料是?请注明技能、推荐阶段和推荐理由。如: 回答《利用 Python 进行数据分析》 @reynd技能: Python
问题如何估算香港一次游行/集会的人数? 回答抽样 @mbpRetina 抽样吧 静态和动态都可以 然后再调权重
问题有 n 个人围成一圈,顺序排号。从第一个人开始报数(从 1 到 3 报数),凡报到 3 的人退出圈子,问最后留下的是原来第几号的那位。 跟群名似乎无关,但是
问题Suppose we a data set where each data point represents a single student’s scor
问题常见的排序算法有哪些?各语言如何实现? 这个问题有点大。因为排序算法有好多,举一个例子就成。而且 R 与 Python 是不是不用考虑排序算法? 回答三类排
问题SQL 语言允许使用通配符进行字符串匹配的操作,其中‘%’可以表示A.零个字符B.1 个字符C.多个字符D.以上都是 回答@bob 替代 0 个或多个字符,
问题t 检验是否要样本数据呈正态分布? 回答抽样分布符合正态就可以用。 @mbpRetina
问题什么是监督学习? 回答有一组已知类别/分类的数据作为样本来训练的模型。 例:knn、贝叶斯分类、回归。 @mbpRetina
问题请用自己的算法, 按升序合并如下两个 list, 并去除重复的元素: list1 = [2, 3, 8, 4, 9, 5, 6]list2 = [5, 6,
问题线性混合效应模型,公式 Y ~ 1 + A + B + (1 | C:D:E),数字 1 和符号 | 各代表什么含义?这种公式怎么理解呢? 回答暂无,前往
问题聚类分析有几种方式,分别在什么情况下使用? 回答聚类一般分为划分法和层次法吧。划分法就是先指定每个类的中心,然后通过计算每个观测和类中心的距离,再调整类中心
问题信度与效度的关系是什么? 回答 信度高是效度高的必要不充分条件。@bob 2) 在社会科学中, 信度(reliability) 是指使用相同的研究技术重复测
数据统计分析与挖掘GithubTelegram