
通常,实验进行前需要仔细控制和测量诸如亮度,声压级,眼球运动,事件时间或硬件的确切位置等变量。
典型的心理物理设置包括一个房间,在这个房间里,你可以在其中理想情况下控制和测量这些因素。
假设这些因素可以为你的研究提供一个感兴趣的变量,或者帮助解释一个潜在的困惑,那么,你可以用更专业的设备来扩展你的心理物理学设置。例如,如果你实验中担心眼睛会随意移动,或者如果你想要测量瞳孔大小来作为唤醒的指标,那么您将需要专业的仪器——眼动仪。
在实验中,你可以通过设计来控制眼球运动的影响因素,也可以通过消除眼球运动的动机来控制影响因素,例如通过使用*小化眼动发生的凝视交叉点。
假设你需要控制眼睛的注视,例如,在受试者没有注视正确位置而中断试验时,就需要使用眼动追踪器。
其次,如果你的实验室有EEG装置,眼电图(EOG)信号可以提供粗略测量的眼球运动。*近强大的深度学习工具也可以用摄像头跟踪眼球运动,但有些只能离线工作。
**,还有许多其他“大脑和周边传感器”可以提供丰富的测量结果来补充行为输出(例如心率、皮肤电导率)。但如果实验需要精确控制不同听觉和视觉事件的时间,考虑使用带有外部设备的验证措施(工具包,例如Black Box Toolkit)。
另外,在购买较昂贵的设备之前,是否与您的工具包的其他部分兼容,如响应设备、可用端口、眼动仪,以及软件和操作系统。
如果你得出结论认为亮度、声音、眼动和其他因素不会影响感兴趣的行为变量,你可以尝试通过同时测试一批受试者来扩大规模,例如在一个带有多个终端的教室里。这样,你可以集体欢迎和引导受试者阅读说明书,并且数据收集将会快得多。对于并行测试,确保增加的分散程度不会对受试者的表现产生负面影响,并且你的代码运行完全顺畅(表2)。
考虑使用更灵活、可能更便宜的设置来运行你的实验,例如平板电脑。
或者,你也可以尝试将你的实验搬到在线环境中进行。在线实验能够将数据收集速度提高数个数量级。但是,这样做的代价是失去实验控制,可能导致数据更加嘈杂。
但如果要在实验室中进行实验,且为了获得相同的统计功效,你将需要大约多30%的参与者(这个估计取决于任务)。
此外,确保你的受试者理解说明书(见第7步中的提示),并且筛选掉那些明显不理解任务的受试者(例如,在说明书后询问理解问题),这也会影响数据质量。
其次,确保你对更多技术方面进行控制,例如强制全屏模式并保护你的实验免受粗心回答。记住,在线众包实验涉及一系列关于支付和利用的伦理问题,以及有关实验协议的额外挑战,这些都需要考虑(第4步)。
用*合适的编程语言编写你的代码,特别是如果你还没有强烈的偏好。
例如,Python是开源的、**的、多才多艺的,目前是数据科学中的**语言,有大量适用于各个水平的教程。
如果你有使用Matlab的强烈理由,Psychtoolbox也是一个不错的选择。
如果你考虑在平板电脑甚至智能手机上运行你的实验,你可以使用StimuliApp。
实在不确定的情况下,可以查看Hans Strasburger的页面,该页面提供了过去25年中各种工具的**且**的概述,以及其他技术提示。
让同事做试点测试是实验室的常见做法,他们可能会提供改进你范式的良好建议,但**雇佣付费志愿者进行试点测试,而不是强迫(即使是不自愿地)你的实验室同事参与(见第7步)。
利用试点测试来调整设计参数,包括刺激的大小和持续时间、遮罩、试验间隔的持续时间以及响应和反馈的方式。在某些情况下,可以考虑使用在线平台进行试点研究,特别是当你想要扫描许多参数时(但见第2步)。
找到实验的正确节奏和难度,以****地减少无聊、疲劳、负荷或冲动反应。
假设选择你感兴趣的主要行为变量,并且,你希望受试者的整体表现处于中间水平,远离100%和偶然性,这样在条件变化时就会产生大的选择方差。(如果任务太难,受试者的表现将接近偶然水平,您可能无法找到任何研究对象下的过程的特征。如果任务太容易,您可能会观察到天花板效应,而且选择模式也不会提供信息。)
一般情况下,可以使用不同难度级别,在实验任务上模拟你的计算模型,看看哪个提供了**的功率,这与调整样本大小的方式类似(见第2步和图2b)。
有一个经验法则,平均表现大约在70%到90%之间的情况下,提供了两种选择强制性任务的**功率。但如果您想减少受试者表现的变异性,或者如果您有兴趣研究个体心理物理学阈值,可以考虑使用自适应程序为每个受试者单独调整难度。
对任务的哪些方面应该是固定节奏或自我节奏需要做出有意识的决定。为了使受试者更容易进行任务,实验可以包含一个非常简单的练习块,并逐渐增加难度,例如通过减少事件持续时间或刺激对比度(即淡入淡出)。确保随着这些新元素的添加提供适当的说明。如果你避免超出受试者的注意力能力,受试者会更快地使过程的一部分自动化(例如,哪些提示与特定规则相关联,按键响应映射等)。
利用试点数据确保受试者的表现在不同块或实验会话中保持相对稳定,但稳定的预估需要一定数量的试验,而权衡这种正确平衡则需要通过经验和试点来确定。
**,与试点受试者进行解释,了解他们理解或不理解的地方(另见第7步),并提出开放式问题,了解他们使用了哪些策略。利用他们的评论来汇集一个有效的说明集,并简化您设计中的复杂部分。
确保你的排除标准(例如,应用于正确试验比例、反应延迟、失误率等的截止阈值)与你的主要问题正交,即它们不会对你感兴趣的变量产生任何系统性偏见。
你可以在收集一组受试者后决定排除标准,但始终在对该组受试者进行主要假设测试之前决定排除哪些参与者(或试验)。在定义在线实验的排除标准时要特别谨慎,因为性能可能更加异质化且潜在更差。不要将相同的标准应用于在线和实验室内实验。相反,运行一组专门的试点以定义适当的标准。所有被排除的受试者应在手稿中报告,并且他们的数据应与其他受试者的数据一起共享(参见第10步)。
04在*终分析中包含试点数据
如果你决定包含试点数据,则不能在该数据上测试实验的主要假设;否则,这将被视为科学不端行为(第6步)。
在决定是否将试点数据包含在主要队列中之前,你对试点数据进行的分析必须与您的主要假设完全正交(例如,如果未经测试的主要假设是关于两个条件之间准确性的差异,可以进行健全性检查以评估参与者的整体准确性是否在某个范围内)。如果您在手稿中包含试点数据,请明确指出哪些数据是试点数据,哪些是本文的主要队列数据。

