問題詳情
26. 下列何者不是維度縮減(dimensionality reduction)之方法?
(A) Random projection
(B) Principal component analysis (PCA)
(C) Clustering algorithms
(D) Classical multidimensional scaling (cMDS)
(A) Random projection
(B) Principal component analysis (PCA)
(C) Clustering algorithms
(D) Classical multidimensional scaling (cMDS)
參考答案
答案:C
難度:計算中-1
書單:沒有書單,新增
內容推薦
- 二項分配和超幾何分配之間,主要的差別在於超幾何分配具有下列何種特質?(A)成功的機率必須小於 0.5 (B)成功的機率必須大於 0.5(C)每次試驗彼此並不獨立 (D)隨機變數是連續的
- 一部門共有10位成員,其月薪(單位: 萬元)分別為:5 , 22 , 6 , 8 , 5 , 6 , 7 , 5 , 12 , 4 。請問中位數為何?(A) 5 (B) 6 (C) 5 (
- 隨機抽取49包二砂糖,樣本平均數為60公斤,樣本變異數為25 公斤2。已知 t48, 0.025 = 0 ,t 48, 0.05 = 7 ,求母體的平均數之95%信賴區間為下列何
- 下列何者不是量測資料分散程度的統計量?(A)眾數 (B)標準差 (C)全距 (D)變異數
- 已知修統計學課程的學生中有 40 % 會參加統計讀書會。根據以往的資料,參加統計讀書會的學生中有 65 % 會拿到成績A,而沒有參加統計讀書會的學生中有 10 % 會拿到成績A。假如在已知某位
- 在下列的敘述中,何種條件下表示有愈多的證據拒絕虛無假設?(A)有愈小的顯著水準 (B)有愈小的 p 值(C)有愈小的臨界值(critical value) (D)有愈小檢定力 (power)
- 假如 ρXY 表示隨機變數X和Y的相關係數,則下列何項正確?(A) ρXY = 0 表示 X 和 Y 獨立 (B) ρXY 可以看出 X 和 Y 有非線性的相關(C) - 1 ≤ ρXY ≤
- 有 4 組數字 G1= (7,9,9,7,5)、G2=(7,6,5,6,7)、G3=(6,6,6,6,6)、G4=(3,4,5,4,3),請問哪一組資料的標準差最大?(A) G1 (B) G2
- 下列何種機率分配,其期望值等於變異數?(A)指數分配 (B)常態分配 (C)卜瓦松分配 (D)二項分配
- 某民調針對某候選人的支持度做調查,以電話隨機抽樣20歲以上民眾於1000份有效樣本中,顯示此候選人在95 %的信心水準下的信賴區間為 (0.33, 0.39),請問若將信心水準改成99 %,此
內容推薦
- 下列選項何者不是Big Data之應用技術?(A) Google 用以指引 Web(index Web) 之技術(B) Facebook 用以建立社交圖(build social graph)
- Gartner Group於2012年定義巨量資料所具備3V的特性,下列敘述何者有誤?(A) 差異(Variation) (B)多樣化(Variety) (C) 超大容量(Volume) (D
- 學者Endsley(1995)針對決策過程所提出的處境察覺(Situation Awareness)模型中,決策人員察覺所處環境的3個狀態:①規劃(projection) ②知覺(percep
- 下列何者是巨量資料領域的資料倉儲系統?(A) HIVE (B) RDBMS (C) HDFS (D) Spark
- GB、PB、TB、EB為4種電腦容量的單位,若依容量由大至小的排序,下列何者正確?(A) PB>TB>EB>GB (B) EB>PB>TB>GB (C) PB>EB>GB>TB (D) TB>
- 有關K-means集群(clustering)演算法,下列敘述何者有誤?(A)不論不相似度測度(dissimilarity measure)為何,均適合採用 K-means 演算法(B)同一筆
- 巨量資料分析資料時,下列何者不是最常用的資料檔案格式來源?(A) CSV (B) XML (C) JSON (D) TIF
- 下列何者不是屬於NoSQL類型的資料儲存?(A) MongoDB (B) CouchDB (C) Redis (D) MySQL
- 某位數據分析師試圖自海量數據中提取潛在且有價值之資訊,此作法稱為下列何者?(A) 資料探勘 (B)資料加密 (C) 資料維護 (D)資料查詢
- 在巨量資料時代中,互聯網上所流動的網路行為資料可被用來從事許多極具價值之商業課題分析,試問下列哪一個工具無法用來捕捉網路流量?(A) Google Analytics (B)百度統計 (C)
- 下列哪一選項不屬於「巨量資料」領域中所稱的資料型態特性?(A)結構化資料 (B)非結構化資料 (C)半結構化資料 (D)去識別化資料
- 試問apriori關連法則演算法中,哪兩項門檻值異動最為顯著影響資料探勘法則之數量?(A)支持度、信賴度 (B)廣泛度、強弱度 (C)精密度、準確度 (D)清晰度、複雜度
- 下列資料何者為結構化資料(Structured Data)?(A)客戶交易資料表 (B)照片分享資料 (C)影音上傳資料 (D)社群討論文章資料
- 關於ETL三個步驟的正確英文全名,下列何者正確?(A) Extraction, Transport, Loading (B) Extraction, Transform, Loading(C)
- 在眾多巨量資料儲存作為中,若將同一份資料以副本方式分別存放在5個不同的場域,此舉主要是希望落實下列哪一個選項?(A)提高資料異地備援能力與系統容錯性 (B)提高資料存取速度與可存取性(C)提高
- 關於巨量資料領域常使用到的集群分析演算法具體作為,下列選項何者有誤?(A) partitioning method (B) hierarchical method(C) density-bas
- 以巨觀的觀點,請將以下各個階段:①資料分析或知識挖掘 ②資料組織 ③資料視覺化或報告④資料收集與準備,按照巨量資料管道(pipelines)的正確順序排序,下列何者正確?(A)③④②① (B)
- 假設您取得了一份含有500位顧客資料的表單,其中的資料欄位包括顧客編號、生日、居住地、交易額,試問此表單最為滿足R語言中的哪一種資料結構?(A)向量 vector (B)矩陣 matrix (
- MapReduce是由Google所提出的一個巨量資料運算架構,試問下列哪一個選項正確表達該架構的資料輸入至輸出之順序?(A)對應(Map)→歸納(Reduce)→排序(Sort)→合併(Me
- 關於資料標準化,下列敘述何者有誤?(A)標準化可用來消除變數之間的尺度差異問題 (B)資料標準化作業發生在資料模型建立後(C)標準化可將各變數的資料範圍予以調整 (D)標準化可用來降低變數之間
- 請問下列何者等於1個EB(Exabyte)?(A) 1024 PB(Petabyte) (B) 1024 TB(Terabyte) (C) 1024 GB(Gigabyte) (D) 1024
- 關於Python語言的特性,下列敘述何者有誤?(A)支援多種作業系統 (B)具備資料分析與視覺化繪圖能力(C)屬於一種常見的編譯式程式語言 (D)可免費使用
- 下列有關深度學習(Deep Leaning)之敘述,何者有誤?(A)深度學習神經網路就是有很多中間層(hidden layers)的反向傳播神經網路(Back-Propagation Net)
- 1依SOLAS 74/78國際公約之規定,所謂「不燃材料」係指依法定程序加熱至多少溫度時,不致於蒸發足夠可燃氣體之材料?(A)1,000゚C(B)750゚C(C)500゚C(D)300゚C
- 下列有關動機的描述,何者符合馬斯洛(A. Maslow)的動機理論?(A)認知衝突與認知失衡讓人有學習動機(B)人有避罰及避免失敗的驅力而投入努力(C)要先適度滿足匱乏需求,學生才有成長需求(D