當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

如何设置？如何分析？一文解释清楚用户研究的可用性测试问卷！

發布時間：2023/12/16 编程问答 35 豆豆

生活随笔收集整理的這篇文章主要介紹了如何设置？如何分析？一文解释清楚用户研究的可用性测试问卷！小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

可用性測試問卷

經過長期的研究和市場驗證，目前已沉淀出很多標準化的可用性問卷，不同的問卷的評估針對性不一樣，可以滿足大部分用研需求。使用標準化的問卷是因為這些問卷是經過大量的使用后驗證校準后產生的，是被認可具有通識性的衡量標準，這些問卷都具備客觀性、重復性、量化、經濟、溝通、科學的普適性的優質屬性。

2.1 標準化的可用性測試問卷

問卷類型主要可以分為以下兩大類：列表中的問卷大部分是需要繳納一定的費用后才能使用，但其中系統可用性整體評估問卷、軟件可用性問卷、場景后問卷是標準可用性問卷中可以免費使用的。應用廣泛且被專家推薦的測試問卷是：軟件可用性問卷主要針對系統或功能進行整體評估，問題設計精煉清晰，使用快捷方便；單項難易度問題追求的是心理測試的簡單和適用性，有5分和7分制，7分制的可靠性更高；主觀腦力負荷問題是在線測試，靈敏性更好。綜合評估下，軟件可用性問卷（Software Usability Scale，SUS）是設計日常中最合適最經濟實用的測試問卷。

2.2 軟件可用性問卷（SUS）

軟件可用性問卷是可用性測試結束時的主觀性評估問卷，應用廣泛，測試后該問卷使用占比約43%。整個問卷共10題，每題為5分制，奇數項為正面描述，偶數項為反面描述，可以通過修改問題文案聚焦測試范圍；如有需要可以將偶數項的問題調整為正面描述，但數據驗證調整為正面描述的問卷結果與包含負面描述的問卷差異不大，不影響問卷的測試結論。在完成測試任務后，用戶需快速完成各個題目，不進行過多思考，若用戶因某些原因無法完成其中某個題目，則視為選擇中間值。

2.3 可用性、易用性抽取

問卷整體可以抽取部分題目作為子測量表來作為單獨的問卷有針對性的進行可用性和易學性測量，可用性由問卷中1-3、5-9題構成，易學性由問卷中4、10題構成。研究表明使用子測量表對量表的可信度的減低可忽略不計（0.92 → 0.91），并且使用子測量表可減少答題時間。

2.4 分值計算

得分計算：范圍在0-4，每題進行轉化分值；奇數題（正面）：原始分減去1，（x-1）；偶數題（負面）：5減去原始分，（5-x）
SUS總分= 所有轉化過的分值相加 * 2.5, 多樣本算SUS總分均值
可用性總分=所有轉化過的可用性分數相加3.125
易用性總分=所有轉化過的易用性分數相加12.5

統計學描述方法

可用性測試因為耗費時間較長，能夠參與測試的用戶資源稀缺，回收樣本量小能夠收集到的樣本量一般會比較小。樣本量小的情況下這個樣本量所能概括的整體是范圍比較大的，會存在較大誤差，那么在較為嚴謹的報告中，可能需要對所得分數和除測試樣本外的分值預期進行描述，這時候會涉及到統計學中常用的描述方式，即通過置信度及置信區間來描述，根據置信區間的下邊界看軟件是否低于行業標準。

3.1 相關概念

置信區間是指在一定概率下包含樣本位置總體參數的這部分數值區間，通過計算置信區間來描述測試結果的概率。置信區間寬度和樣本量之間是一個逆平方根的關系，樣本量越小，誤差越大，未知樣本數據可能所在的區間更大。
置信度就是說，你測得的均值，和總體真實情況的差距小于這個給定的值的概率，應該是1-α；換句話描述，即我們有1-α的信心認為，你測得的這個均值和總體的實際期望很接近了（測得的均值就是總體期望是很草率的，但是說，我有95%的把握認為我測得的均值，非常接近總體的期望了）。研究員可以選擇0%-100%之間的任意數值的置信度，通常設為90%或95%（最常用）。
臨界值是在原假設下，檢驗統計量在分布圖上的點，這些點定義一組要求否定原假設的值。

3.2 置信區間計算

置信區間= （樣本平均值-誤差幅度）～（樣本平均值+誤差幅度）=（x -（x- μ））～（x +（x- μ））
x = 樣本平均值
誤差幅度=臨界值（樣本標準差/樣本量的平方根），即：（x - μ） = α* （s / sqrt（n））
α=臨界值（Excel函數=TINV（1-置信度，樣本量-1））
μ=被檢驗的基準值（行業標準）
s=樣本的標準差（Excel函數=STDEVP（N1，N2，…））
n=樣本量*
tips：臨界值可以通過所設置信度和樣本量在t分布表中查找相應的值