📗
deeplearning
  • 机器学习
    • LR & SVM
    • 树模型
    • 评测指标
    • 数据不平衡
  • CV基础
    • 基础模型
    • 初始化
    • 激活函数
    • 注意力机制
    • 损失函数
    • 优化器
    • 可视化
    • 轻量级网络
    • 多任务学习
  • deepfake
    • 数据集
  • 人脸
    • 数据集
    • 人脸对齐
    • 人脸检测
    • 人脸识别
  • 语义分割
    • 语义分割
  • 无监督
    • 无监督
  • 推荐系统
    • 推荐系统模型
    • 推荐系统中的偏差
    • 王喆:深度学习推荐系统
    • 特征处理
    • 重排序
    • 互联网商业化变现
  • 数学
    • bayes最大似然
    • 蒙特卡洛
  • 网站
    • css
    • html
    • js
    • jquery
    • flask
  • 基础工具
    • anaconda
    • docker
    • git
    • linux install
    • vpn
    • latex
  • python
    • numpy
    • matplotlib
    • pandas
    • multi process
    • pytorch
  • 设计模式
    • 设计模式之美
    • 图说设计模式
  • 其他
    • how to ask
    • python style
Powered by GitBook
On this page

Was this helpful?

  1. 机器学习

数据不平衡

Previous评测指标Next基础模型

Last updated 3 years ago

Was this helpful?

  • 欠采样

    • 代表方法有easyEnsemble,利用集成学习,将反例划分成不同的集合供不同的学习器使用,这样对每个学习器都进行了欠采样,但是全局不丢失信息。

  • 过采样

    • 不能简单的对正例进行重复采样,会导致过拟合

    • 代表方法有SMOTE(Synthetic Minority Oversampling Technique),对正例进行插值产生额外的正例

  • 再缩放方法(rescaling)和阈值移动thresh-moving