問題詳情
46. 資料前處理在資料探勘是一個非常重要的步驟,下列哪一個步驟不屬於資料前處理?
(A)模型解釋
(B)處理遺失值
(C)移除離群值
(D)資料數值正規化
(A)模型解釋
(B)處理遺失值
(C)移除離群值
(D)資料數值正規化
參考答案
答案:A
難度:非常簡單1
統計:A(1),B(0),C(0),D(0),E(0)
內容推薦
- 甲以其妻乙為被保險人,向保險公司投保人壽保險,並指定甲以及其子丙同為受益人。訂立契約後,受益人丙故意致乙死亡,下列敘述何者正確?(A)保險人不負保險責任(B)保險人得解除該契約(C)保險人仍應
- 下列的統計學習(Statistical Learning)方法經常被用於分析巨量資料,請問何者應用的領域問題與其它不同?(A)隨機森林(Random Forests) (B)主成分分析(Pri
- 下列哪項不是 Apache Spark 0 所支援的程式語言?(A) Scala (B) R (C) C++ (D) Python
- 如何降低模型過適(Overfitting)問題?(A)降低資料量(B)在目標函數中加入參數正則化(Regularization) 項(C)對資料作正規化(Normalization)前處理(D
- 下列何者依現行公司法規定非為關係企業?(A)有控制與從屬關係之公司 (B)公司與他公司相互投資各達對方有表決權之股份總數三分之一以上者之公司(C)設有總管理處之企業集團(D) A公司持有B公司
- 在巨量資料分析專案中,下列何者比較無助於提升分類模型準確度(Accuracy)?(A)使用交叉驗證(Cross-Validation)(B)增加或減少模型參數(Parameters)以提升或降
- 一、部落青年會擬於收穫祭結束後辦理少年文化成長班。請詳述您如何有效運用家庭資源管理的步驟,協助部落族人規劃此文化振復活動?(25 分)
- 下列統計學習(Statistical Learning)的方法或過程,何者不易受到變數尺度(Scale)不同的影響?(A)決策樹學習(Decision Tree Induction) (B)
- 下列何種資料格式經常被定義為半結構化資料(Semi-structured Data)?(A)關聯式資料庫中的表格(Table)資料 (B)影音(Video)檔案(C) JSON 檔案 (D)
- 六、請依非都市土地使用管制規則之規定,說明非都市土地在何種情況下得變更編定為丁種建築用地。(15 分)
內容推薦
- 有關隨機森林(Random Forests)之敘述,下列何者正確? (A)採用 Boosting 方法(B)使用多個淺層決策樹 (Decision Stump) 構建整個森林(C)是一種重抽樣
- 要保人詐欺為超額保險,依保險法規定,其保險契約效力為何?(A)保險人得解除契約(B)保險人得撤銷保險契約(C)保險人得主張保險契約無效(D)保險契約仍有效,但保險人不負保險責任
- 請問以下關於有限公司的敘述,何者有誤?(A)公司增資經股東過半數同意後,每一位股東即有按原出資比例出資之義務(B)公司以董事為執行業務機關,而非董事之股東均得行使監察權(C)由於有限公司之人合
- 在Hadoop中,下列何者為有效的資料分析流程?(A)Input → Reducer → Mapper → Combiner → Output(B)Input → Mapper → Reduc
- 有關類神經網路(Neural Network)之敘述,下列何者有誤?(A)使用成千上萬個神經元(Neuron)作為處理器(B)其學習過程是一個不斷的嘗試錯誤(Trial and Error)
- 在統計學習(Statistical Learning)方法論中,有關模型的過適(Overfitting)之敘述,下列何者有誤?(A)此種模型的錯誤(Error)常來自於高的方差(High Va
- 保險法第64條據實說明義務之立法意旨,是保險最大誠信原則與下列何者的運用?(A)損害填補(B)對價平衡(C)利得禁止(D)保險利益
- A股份有限公司本年度稅前純益為三億元,A公司欲分派本年度之盈餘給股東,在一般情形下,請問依公司法之規定,下列事項之先後順序為何?○1 完納稅捐 ○2 提列法定盈餘公積 ○3 彌補虧損 ○4 分
- 資料視覺化是資料處理中一項重要工作,通常資料視覺化需要使用到下列哪種方法?(A)資料維度降維 (B)建立分類模型 (C)建立迴歸模型 (D)調整模型參數
- 有關應用卷積神經網路(Convolutional Neural Networks,簡稱CNNs)於影像分析之敘述,下列何者正確?1 較前面的處理層 (Layer) 過濾器通常可包含邊緣偵測器
- 有關近年來巨量資料處理與分析的發展,下列何者有誤?(A)異質運算(Heterogeneous Computing)的興起 (B)記憶體內運算(In-memory Computing)的普及(C
- 依我國現行保險法,貨物之保管人對於所保管之物,於何程度有保險利益?(A)以保管物之價值為限(B)以信託行為之範圍為限(C)以保管物之損害為限(D)以保管人所負之責任為限
- 背書人於票據到期日後所為之背書,依法有何法律效力?(A)無任何法律效力(B)有背書之效力(C)僅有通常債權轉讓之效力(D)經背書人同意後,仍有背書之效力
- 下列何者並非Hadoop與Spark共同擁有的特色?(A)皆為叢集計算環境(B)皆擁有自己的檔案系統(C)皆使用開放原始碼應用程式介面 (API) 來連結其他資料分析工具(D)皆為資料處理平台
- 有關分析巨量社群網路資料之敘述,下列何者有誤?(A)連結預測(Link Prediction) 之技術可用來推薦朋友(B)使用者的朋友個數之分配通常遵從冪次法則(Power-law distr
- 有關巨量資料分析的平台環境建置之敘述,下列何者正確?(A)傳統的關聯式資料庫管理系統無法處理巨量資料(B)NoSQL資料庫系統已逐漸取代傳統的關聯式資料庫系統(C)Apache Hadoop可
- 定值保險係指下列何種保險契約?(A)契約上載明一定保險金額(B)契約上載明一定賠償金額(C)契約上載明保險標的一定價值(D)契約上載明損失發生時賠付一定價值
- 甲簽發金額為30萬元之無記名支票一紙予乙,並於票據上記載「禁止背書」,乙於空白背書後將該支票轉讓予丙,丙將該支票空白背書予丁,試問下列敘述何者正確? (A)甲於該票據上為「禁止背書」之記載,該
- 下列哪項不是主成分分析(Principal Component Analysis)之特性?(A)屬於非線性降維方法 (B)第一主成分跟第二主成分會正交(C)通常可以提升模型訓練速度 (D)屬於
- 有關頻繁樣式探勘(Frequent Pattern Mining) 之敘述,下列何者有誤?(A)若一項目集合之所有子集合皆為頻繁,則該項目集合必定也為頻繁(B)所有最大(maximal) 頻繁
- 有關 MapReduce程式模型(Programming Model)之敘述,下列何者有誤?(A)比較不適合用來處理疊代式(Iterative) 的資料處理分析過程(B)概念來自於函數式程式語
- 王老師在課堂上想教導學生將生活中的資料整理過後,並製作長條圖,此班級最為可能為哪一階段?(A)低年級 (B)中年級 (C)高年級 (D)國中階段
- 甲於乙所簽發本票上為其保證,關於甲之權利義務,下列敘述何者錯誤?(A)甲得主張先訴抗辯權(B)甲應對乙之本票債務負票據責任(C)甲所負之債務,時效消滅為三年(D)甲清償債務後,得行使執票人對乙
- 一、小岳在學校常常動不動就大聲罵人,甚至打人,陳老師想進一步了解小岳在家裡的行為表現情形,於是邀請小岳爸爸到學校個別會談。小岳爸爸跟陳老師說:「他打人,你就打他,或叫小孩打回去,他就怕了啦!」【題組】
- 巨量資料庫管理最常用的操作包含Selection、Projection、Union與Intersection。對於此4種資料庫操作,若想實作在Hadoop的工作任務中,哪2種操作需要同時使用一