> 数据图表如何看待alpha158因子分类2024-6-6数据集 6 为来自于 qlib3的 alpha158,特征是基于股票量价数据构建的常见技术类因子。若将 158 个特征同时输入神经网络,其对算力、显存具有较高要求,因此我们对特征做适当聚类预处理。 我们以谱聚类算法做特征聚类。谱聚类算法将数据集中的每个对象看作是图的顶点 X,将顶点间的相似度量化作为相应顶点连接边 E 的权值,这样就得到一个基于相似度的无向加权图 GX, E,于是聚类问题就可以转化为图的划分问题。 我们基于训练集数据统计因子相关性,并以因子相关性作为顶点间的相似性度量,将 158个聚类成 8 个类别,每个类别内特征取均值得到 8 个综合特征作为网络模型的输入。国盛证券金融地产