这是命令 liblinear-train 可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
liblinear-train - 训练线性分类器并生成模型
概要
线性库 [选项] 训练集文件 [模型文件]
商品描述
线性库 使用 liblinear 训练线性分类器并生成适合的模型
用于 liblinear-预测(1)。
训练集文件 是包含用于训练的数据的文件。 模型文件 是
模型将保存到的文件。 如果 模型文件 未提供,默认为
训练集文件.model.
为了获得良好的性能,有时需要对数据进行缩放。 这可以用
支持向量机规模(1)。
配置
下面是选项的摘要。
-s 类型
设置求解器的类型:
0 ... L2 正则化逻辑回归
1 ... L2-regularized L2-loss 支持向量分类(双)(默认)
2 ... L2-regularized L2-loss 支持向量分类(原始)
3 ... L2-regularized L1-loss 支持向量分类(双重)
4 ... 多类支持向量分类
5 ... L1-regularized L2-loss 支持向量分类
6 ... L1 正则化逻辑回归
7 ... L2-正则化逻辑回归(双)
-c 成本
设置参数 C(默认: 1)
-e 小量
设置终止标准的容差
对于 -s 0 和 2:
|f'(w)|_2 <= 小量*min(pos,neg)/l*|f'(w0)_2,其中 f 是
原始函数和 pos/neg 是正/负数据的数量
(默认: 0.01)
对于 -s 1、3、4 和 7:
双重最大违反 <= 小量; 类似于 libsvm(默认: 0.1)
对于 -s 5 和 6:
|f'(w)|_inf <= 小量*min(pos,neg)/l*|f'(w0)|_inf,其中 f 是原始值
功能(默认: 0.01)
-B 偏见
If 偏见 >= 0,则实例 x 变为 [x; 偏见]; 如果 偏见 < 0,则
不添加偏置项(默认: -1)
-wi 重量
weight-调整类的参数C i 按价值 重量
-v n n-折叠交叉验证模式
-C 查找参数 C(仅适用于 -s 0 和 2)
-q 安静模式(无输出)。
示例
使用 L2 损失函数训练线性 SVM:
liblinear-train 数据文件
训练逻辑回归模型:
liblinear-train -s 0 数据文件
使用 L2-loss SVM 进行五折交叉验证,使用较小的停止容差 0.001
而不是默认的 0.1 以获得更准确的解决方案:
liblinear-train -v 5 -e 0.001 数据文件
通过 L2-loss SVM 进行多次交叉验证,找到达到的参数 C
最佳交叉验证准确度:
train -C 数据文件
对于 -C 的参数选择,用户可以指定其他求解器(当前 -s 0 和 -s 2
支持)和不同数量的 CV 折叠。 此外,用户可以使用 -c 选项来
指定搜索范围的最小 C 值。 当用户需要时,此设置很有用
在不同的设置下从指定的 C 重新运行参数选择程序,
例如上例中更严格的停止容差 -e 0.0001。
train -C -s 0 -v 3 -c 0.5 -e 0.0001 数据文件
训练四个分类器:
正负 Cp Cn
1 级 2,3,4、20、10 级 XNUMX XNUMX
2 级 1,3,4、50、10 级 XNUMX XNUMX
3 级 1,2,4、20、10 级 XNUMX XNUMX
4 级 1,2,3、10、10 级 XNUMX XNUMX
liblinear-train -c 10 -w1 2 -w2 5 -w3 2 Four_class_data_file
如果只有两个类,我们训练一个模型。 两个类的 C 值为 10
和50:
liblinear-train -c 10 -w3 1 -w2 5 两个类数据文件
输出概率估计(仅适用于逻辑回归)使用 liblinear-预测(1):
liblinear-predict -b 1 test_file data_file.model 输出文件
使用 onworks.net 服务在线使用 liblinear-train