その他令和8年1月7日

データ前処理・特徴工程・モデル訓練 (中国語) - DOI: 10.1016/j.jclepro.2021.126489

掲載日
令和8年1月7日
号種
号外
原文ページ
p.8
出典:官報発行サイト(内閣府)の掲載情報をもとに整理しています。重要な確認は公式原文を基準にしてください。

本文と原文の対照

まず左側の本文を読み、必要な箇所だけ原文ページで確認できる構成です。

← 同日の官報に戻る
原文対照の表示オプション

データ前処理・特徴工程・モデル訓練 (中国語) - DOI: 10.1016/j.jclepro.2021.126489

令和8年1月7日|p.8

左の本文を選ぶと、右側の官報原文画像で該当箇所を照合できます。

公式原文あり本文テキスト画像照合可誤りを報告
2.2 研究方法
本研究では、混合研究法を採用し、定量的データ分析と定性的インタビューを組み合わせる。まず、既存の教育プラットフォームから匿名化された学習ログデータを収集し、機械学習アルゴリズムを用いてパターン分析を行う。次に、対象校の教員および生徒に対して半構造化インタビューを実施し、システム利用時の実態や課題を把握する。
在训练模型之前,需要对数据进行预处理。首先,将数据集划分为训练集和测试集,通常采用 8:2 的比例。然后,对文本进行分词、去除停用词等操作。对于图像数据,需要进行归一化处理,将像素值缩放到 [0,1] 区间。此外,还需要处理缺失值和异常值,确保数据的质量。
## 2.2.3 特征工程
特征工程是机器学习中的关键步骤。对于文本数据,可以使用 TF-IDF、Word2Vec 等方法提取特征。对于图像数据,可以使用预训练的卷积神经网络(如 ResNet、VGG)提取特征向量。此外,还可以根据领域知识构造新的特征,例如时间特征、统计特征等。特征选择也是重要的一环,可以通过相关性分析、递归特征消除等方法选择最重要的特征。
## 2.2.4 模型训练与评估
选择合适的模型进行训练,常见的模型包括逻辑回归、支持向量机、随机森林、梯度提升树等。对于深度学习任务,可以使用卷积神经网络、循环神经网络等。在训练过程中,需要使用交叉验证来评估模型的性能,常用的评估指标包括准确率、精确率、召回率、F1 分数等。同时,还需要关注模型的过拟合问题,可以通过正则化、早停等方法来缓解。
読み込み中...
データ前処理・特徴工程・モデル訓練 (中国語) - DOI: 10.1016/j.jclepro.2021.126489 - 第8頁
テキスト領域
選択中
非公開 (PII)
関連する新着公告を見逃さないために

Pro プランでは会社名・機関名・キーワードを監視条件として保存し、新着掲載を継続確認できます。14日間無料で試せます。

監視機能の詳細を見る →