您可以as_matrix
直接在数据框对象上使用方法将数据框转换为矩阵。您可能需要指定感兴趣的列,X=df[['x1','x2','X3']].as_matrix()
其中不同的x是列名。
对于y变量,您可以y = df['ground_truth'].values
用来获取数组。
import numpy as np
#create a 5X5 dataframe
df = pd.DataFrame(np.random.random_integers(0, 100, (5, 5)), columns = ['X1','X2','X3','X4','y'])
调用as_matrix()
上df
返回一个numpy.ndarray
对象
X = df[['X1','X2','X3','X4']].as_matrix()
调用从熊猫values
返回anumpy.ndarray``series
y =df['y'].values
注意:您可能会收到一条警告:FutureWarning: Method .as_matrix will be removed in a future version. Use .values instead.
要修复它,请使用values
而不是as_matrix
如下所示
X = df[['X1','X2','X3','X4']].values