归纳数据集;金融数据标准化;支持向量机分类模型的选择和应用;用支持向量机模型进行预测; 模型评估
适用人群
学习金融学、数据、计算机的高校生、在职的基金经理、投研总监、专业投资者、金融分析师、量化分析
课程简介
案例数据集来源于UCI网站。该数据集中的图象数据分别来源于真纸币和伪纸币。通常是通过工业相机生成400x 400像素的图象。然后利用小波变换工具从图象中提取相关特征。数据集中共有1372条记录,4个连续型的特征变量,和1个二元分类变量,无缺失数据。
支持向量机分类算法是机器学习中的一个基础且非常重要的算法。它利用传统的数学优化方法,即,二次函数的优化,对数据进行分类。Python的优势在于开源,基于Python的各类机器学习算法非常丰富而且方便使用。我们将以纸币识别案例数据集为一个点的同时,讨论支持向量机分类原理和Python算法并用他们来区分真纸币和伪纸币。
本案例的特点是将识别真假纸币的金融决策问题的解决方案与机器学习中的支持向量机算法进行结合,并利用Python设计一个自动分类算法来对案例数据集进行学习并辅助我们进行决策。这三者的结合就是智能金融在金融行业的一种经典应用。
学生通过本案例的学习将能够充分理解并在未来能够使用支持向量机算法和Python程序来解决一个具体金融决策问题。本案例中还将介绍数据预处理和变量工程概念,从而有助于掌握数据处理的方法和技巧。
通过案例学习后,如果学生能够独立完成作业,学生将能达到以下预期目标:
能够将归纳一个金融问题的数据集;
2. 金融数据的处理和标准化;
3. 支持向量机分类模型的选择和应用;
4. 用支持向量机模型进行预测;
5. 对支持向量机模型进行评估 |