![](https://static.youtibao.com/asksite/comm/h5/images/m_q_title.png)
[多选题]
在分类问题中,我们经常会遇到正负样本数据量不等的情况比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是()。
A.将负样本重复10次生成10w样本量打乱顺序参与分类
B.直接进行分类可以最大限度利用数据
C.从10w正样本中随机抽取1w参与分类
D.将负样本每个权重设置为10,正样本权重为1,参与训练过程
查看答案
![](https://static.youtibao.com/asksite/comm/h5/images/solist_ts.png)
A.将负样本重复10次生成10w样本量打乱顺序参与分类
B.直接进行分类可以最大限度利用数据
C.从10w正样本中随机抽取1w参与分类
D.将负样本每个权重设置为10,正样本权重为1,参与训练过程
INTERNET应用中,我们经常会遇到一个词DNS,DNS的作用是______。
A.将数字信号转变成模拟信号
B.将文本文件转换为二进制文件
C.将十进制数转换成二进制数
D.将域名转换为IP地址
A.级别划分较多的属性不会影响模型效果
B.在某些噪音较大的分类或回归问题上不会过拟合
C.每次学习使用不同训练集,一定程度避免过拟合
D.能够处理高纬度的数据,并且不做特征选择
某人试图建立我国有色金属行业生产方程,选择如下变量及关系形式:
产值=α0+α1·固定资产原值+α2·职工人数+α3·电力消耗量+μ选择1978—1996年的数据为样本观测值,采用OLS方法估计参数,样本观测值的计量单位为:产值采用不变价计算的价值量,固定资产原值采用形成年当年价计算的价值量,其他采用实物量单位。指出该计量经济学问题中可能存在的错误,并简单说明理由。