半导体制造过程中的数据

大约 4 分钟SECOM数据集半导体半导体制造半导体故障诊断预测

1、数据集描述

标题:SECOM数据集 摘要:半导体制造过程中的数据


数据集特征:多变量

实例数:1567

领域:计算机

属性特征:真实

属性数量:591

捐赠日期:2008-11-19

相关任务:分类、因果发现

缺少值?对


资料来源: 作者:Michael McCann,Adrian Johnston


数据集信息:

复杂的现代半导体制造工艺通常不一致通过监测从传感器收集的信号/变量进行监测,和/或过程测量点。然而,并非所有这些信号都具有同等价值在特定的监控系统中。测量信号包含以下各项的组合有用信息、不相关信息以及噪声。这种情况经常发生有用的信息隐藏在后两者之中。工程师通常有比实际需要的信号数量多得多。如果我们考虑每种类型将信号作为特征,则可以应用特征选择来识别最多相关信号。然后,工艺工程师可以使用这些信号来确定关键在该过程中导致下游产量偏移的因素。这将能够提高流程吞吐量,减少学习时间,并减少单位生产成本。

为了增强当前的业务改进技术,功能的应用选择作为一种智能系统技术正在研究之中。在这种情况下呈现的数据集代表了这样的特征的选择,其中每个示例都表示一个具有相关测量值的单个生产实体特征和标签表示内部生产线的简单合格/不合格率测试,图2,以及相关的日期时间戳。其中.1对应于一个通行证1对应于失败,数据时间戳用于该特定测试指向使用特征选择技术,期望根据它们对产品总产量的影响,因果关系也可能是为了识别关键特征而考虑。可以根据特征相关性提交结果,以便使用错误率作为我们的评估指标。建议交叉验证应用于生成这些结果。下面显示了一些基本的基线结果使用简单核脊分类器和10倍的特征选择技术交叉验证。

基线结果:将预处理对象应用于数据集,只是为了对数据进行标准化,删除不变的特征,然后选择40个排名最高的特征的不同特征选择对象应用一个简单的分类器来获得一些初步结果。十折十字形使用了验证,并生成了平衡错误率(*BER)作为我们的初始值性能指标,以帮助调查此数据集。

SECOM数据集:1567个示例591个功能,104个失败 FSmethod(40个功能)误码率%True+%True-% S2N(信号噪声比)34.5+-2.6 57.8+-5.3 73.1+2.1

T测试33.7+-2.1 59.6+-4.7 73.0+-1.8

减压40.1+-2.8 48.3+-5.9 71.6+-3.2

皮尔逊34.1+-2.0 57.4+-4.3 74.4+-4.9

Ftest 33.5+-2.2 59.1+-4.8 73.8+-1.8英尺

葛兰施密特35.6+-2.4 51.2+-11.8 77.5+-2.3


属性信息:

关键事实:数据结构:数据由2个文件组成数据集文件SECOM

由1567个例子组成,每个例子有591个特征,1567 x 591矩阵和标签

包含每个示例的分类和日期时间戳的文件。与任何现实生活中的数据情况一样,该数据包含的空值在强度取决于个体特征。这需要考虑通过预处理或内部调查数据时的考虑因素所应用的技术。

数据在原始文本文件中表示,每一行代表一个单独的示例和由空格分隔的特征。空值由表示

根据MatLab的“NaN”值。

2、数据获取

数据收集于网络,获取方式

半导体制造过程数据集
半导体制造过程数据集

关注公众号52phm,回复半导体数据即可获取数据下载链接。

3、参考资料

智能制造数据集open in new window