這個問題包含了很多的步驟:①特征提取:特征值的獲取可以來源于他人已得到的數據(數據庫),也可以高通量計算獲得,還可以通過結構的坐標通過一定的算法公式轉換為特征值;②將不同結構對應的特征值存到數據庫,通過條件的組合來層層篩選物性,excel沒有組合篩選的功能,數據量較大時會使電腦卡頓,所以這一步用數據庫最好。
無論是特征提取還是數據篩選,都是需要很強的編程基礎和理論計算基礎的,推薦大家嘗試下MatCloud+,高通量計算,數據自動保存到數據庫,內置高級數據檢索功能,檢索得到的數據結果也可以直接在平臺上進行機器學習,很方便。