train_test_split函数是用来将数据集划分为训练集和测试集的
train_test_split函数是用来将数据集划分为训练集和测试集的。在Python中,train_test_split函数可以通过sklearn库中的model_selection模块来使用。下面是一个简单的示例:
fromsklearn.model_selectionimporttrain_test_split
importnumpyasnp
#生成一些示例数据
X=np.array([[1,2],[3,4],[5,6],[7,8]])
y=np.array([0,1,0,1])
#将数据集划分为训练集和测试集,test_size指定测试集比例,random_state设置随机种子
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2,random_state=42)
#打印划分后的训练集和测试集
print("训练集X:",X_train)
print("测试集X:",X_test)
print("训练集y:",y_train)
print("测试集y:",y_test)
在这个示例中,我们生成了一个包含4个样本的数据集X和对应的标签y。然后使用train_test_split函数将数据集划分为训练集和测试集,其中test_size参数指定了测试集的比例(这里是0.2,即20%),random_state参数设置了随机种子以确保划分结果的一致性。最后打印出划分后的训练集和测试集。
版权声明
本文仅代表作者观点,不代表博信信息网立场。