大數據測試需要掌握哪些知識?
1.什么是大數據?
大數據是一個龐大的數據集,傳統計算技術無法處理。這些數據集的測試需要使用各種工具、技術和框架來處理。大數據涉及數據創建、存儲、檢索和分析,在數量、多樣性和速度方面都很出色。它是一種海量、高增長、多元化的信息資產,需要新的處理模式來擁有更強的決策力、洞察和發現能力以及流程優化能力。
2.大數據測試類型
測試大數據應用更多的是驗證其數據處理,而不是測試軟件產品的單個功能。說到大數據測試,性能和功能測試是關鍵。處理有三種類型:
一批
實時
交互在測試一個應用之前,需要檢查數據的質量,并將其作為數據庫測試的一部分。它涉及檢查各種字段,如一致性、準確性、重復性、一致性、有效性、數據完整性等等。
3.容錯測試
它可以從部分故障中自動恢復,整體性能不會受到驗證的影響。特別是當出現故障時,大數據分析系統在恢復的同時要繼續以可接受的運行,在出現錯誤時也能在一定程度上繼續運行。需要根據應用場景設計解決方案和具體部署,然后手動測試。
4.可用性測試
高可用性是大數據分析不可或缺的特性之一,從而保證了數據應用業務的連續性。大數據的高可用性對于很多應用來說非常關鍵,需要嚴格的測試和驗證,主要是人工測試。
5.延展性測試
彈性可擴展性對于大數據時代的文件系統尤為重要。文件系統的可伸縮性測試主要包括測試系統的彈性可伸縮性(擴展/收縮)和擴展系統帶來的性能影響,驗證是否具有線性可伸縮性,主要通過手工測試。
6.穩定性試驗
大數據分析系統通常是長時間連續運行的,穩定性的重要性不言而喻。穩定性測試主要驗證系統在長時間(7/30/180/365*24)后是否還能正常運行,功能是否正常。穩定性測試通常以自動化的進行,LTP、10ZON
SQLServer主從數據同步,如何解決延時?
SQLServer中的高可用性功能在工作中使用SQLServer的高可用性功能的場景是數據庫主從復制。有三種功能可以使用:復制、鏡像和日志傳輸。復制(發布-訂閱模式):
嚴格來說,復制不是為高可用性而設計的功能,但它可以應用于高可用性。復制在數據庫對象級別提供保護。復制使用發布-訂閱模式,即主服務器(稱為發布服務器)將數據發布到一個或多個輔助服務器或訂閱服務器。這些服務中提供復制功能。服務器提供實時可用性和可伸縮性。它支持為訂閱者提供數據子集的篩選,還支持分區更新。訂閱者是聯機的,可以用于報表或其他功能,而無需查詢恢復。
SQLServer提供四種類型的復制:快照復制、事務復制、對等復制和合并復制。
我們一般選擇快照復制或者事務復制。兩者的概念介紹如下:
快照復制
1.概念快照復制是完全根據數據和數據庫對象出現時的狀態來復制和分發數據和數據庫對象的過程。快照復制不需要持續監視數據更改,因為發布的數據更改不會以增量傳播到訂閱服務器,而是定期復制一次。
2.適用性數據主要是靜態的,比如將一個數據倉庫復制到一個數據集市中,這允許在一段時間內使用過時的數據副本。小批量數據站點通常是斷開的,可以接受高延遲。
事務復制
1.該概念使用事務復制,初始快照數據將傳播到訂閱服務器,因此訂閱服務器有所謂的初始加載,即可以啟動的內容。當發布服務器上發生數據修改時,這些單獨的事務將被及時捕獲并復制到訂閱服務器。并保持交易邊界。當所有更改都傳播后,所有訂閱服務器都將具有與傳播服務器相同的值。
2.在適用的情況下,數據修改通常會在發生后的幾秒鐘內傳播到訂閱服務器,其事務是原子事務的訂閱服務器需要創建一個發布-訂閱數據庫服務器,該服務器的名稱不能是IP,而只能是特定的服務器名稱,例如: