-
来
源
:
/ml/?fo
rmat=&task=&att=&area=&numAtt=&n
umIns=&
type=&sort=nameUp&view=list
Table View
List
View
206
Data
Sets
1.
Abalone
: Predict the age of
abalone from physical measurements
鲍鱼
p>
DataSet
:根据物理度量,预测鲍鱼的年龄。
2.
Abscisic Acid
Signaling Network
: The objective is to
determine the set of
boolean rules that
describe the interactions of the nodes within this
plant
signaling network. The dataset
includes 300 separate boolean pseudodynamic
simulations using an asynchronous
update scheme.
目标是测定布尔值的度量集
合,以描述植物的信号网路节点。该数据集包括了
300
个独立
的布尔值形式的虚拟动态模拟值,使用了异步更新的架构。
3.
Acute
Inflammations
: The data was created by
a medical expert as a data
set to test
the expert system, which will perform the
presumptive diagnosis of
two diseases
of the urinary system.
急性炎症
DataSet
:数据来源于一位医学专家的数据集,用以检测
专家系统,可
以推断出泌尿系统的两种疾病的诊断结果。
4.
Adult
: Predict
whether income exceeds $$50K/yr based on census
data.
Also known as
成人
DataSet
:根据户口普查资料,预测收入是否能超过
< br>50000
美元
/
年。通常
p>
也被称为“收入普查”数据集。
5.
Annealing
: Steel annealing
data
退火
DataSet
:训练
退火数据。
6.
Anonymous Microsoft Web
Data
: Log of anonymous users of
; predict areas of the web site a user
visited based on data
on other areas
the user visited.
匿名微软网络数据:微软网站的匿名用户记录;
通过其他的用户访问区域数据,
预测用户在
web
站点的访问区域。
7.
Arcene
: ARCENE's task is to
distinguish cancer versus normal patterns
from mass-spectrometric data. This is a
two-class classification problem with
continuous input variables. This
dataset is one of 5 datasets of the NIPS 2003
feature selection challenge.
ArceneDataSet
:该数据集的任务是根据大量的观测数据,从正常的模式
中辨别
出癌症。这是一个根据不断输入的变量的二级分类问题。该数据集是从
NIPS2003
特征选择挑战比赛中的
5
个数据集之一。
8.
Arrhythmia
: Distinguish
between the presence and absence of cardiac
arrhythmia and classify it in one of
the 16 groups.
心率失常
DataSet
p>
:分辨是否出现心率失常,并将结果分类进
16
个组之一。
9.
Artificial Characters
:
Dataset artificially generated by using first
order
theory which describes structure
of ten capital letters of English alphabet
人为性状
DataSet
:
通
过使用第一次序理论
(该理论可以描述出英语字母表的十
个开头
字母的结构),自动生成的数据集。
10.
Audiology (Original)
:
Nominal audiology dataset from Baylor
原
始
AudiologyDataSet
:来自
< br>Baylor
的标称型的
audiology
数据集。
11.
Audiology (Standardized)
:
Standardized version of the original audiology
database
标准
Audiol
ogyDataSet
:原始
Audiology
数据集的标准化版本。
12.
Australian Sign Language
signs
: This data consists of sample of
Auslan
(Australian Sign Language)
signs. Examples of 95 signs were collected from
five signers with a total of 6650 sign
samples.
澳大利亚标记语言标记
DataSet
p>
:这些数据包括了澳大利亚标记语言标记的样
本。
< br>95
个实例,均来自五个标识器,其中有
6650
个标记样本。
13.
Australian Sign Language signs (High
Quality)
: This data consists of
sample of Auslan (Australian Sign
Language) signs. 27 examples of each of
95 Auslan signs were captured from a
native signer using high-quality position
trackers
澳大利亚标记语言标记
DataSet
高品质版:
该数据集包含了
Auslan
标记的样本。
有
27
个实例,它们来自
95
个标记,这
27
个实例是使用高质量位置追踪器的当
地标识器捕捉出来的。
14.
Auto MPG
: Revised from CMU
StatLib library, data concerns city-cycle
fuel consumption
自动
MPGDataSet
:来自
CMU StatLib
p>
实验室的精品,是与城市循环能源消耗
相关的数据集。
15.
Automobile
: From 1985 Ward's
Automotive Yearbook
汽车
DataSe
t
:来自
1985
的沃德自动化年鉴。
16.
AutoUniv
: AutoUniv is an
advanced data generator for classifications
tasks. The aim is to reflect the
nuances and heterogeneity of real data. Data
can be generated in .csv, ARFF or C4.5
formats.
AutoUniv
是一个高级数据生成器,
可以用来处理分类任务。目标是反映现实数
据的微妙与不同之处。数据可以在
.csv
中生成,采用
ARFF
< br>或者
C4.5
的格式。
17.
Bach
Chorales
: Time-series data based on
chorales; challenge is to learn
generative grammar; data in Lisp
基于
Chorales
的时间序列数据集;可以用来
挑战生成性的语法;数据放在
Lisp
中。
18.
Badges
:
Badges labeled with a
徽章
Data
Set
:标记了“
+
”或“
-
”的符号的标记,可以作为一个人姓名的函数
表
达式。
19.
Bag of
Words
: This data set contains five text
collections in the form of
bags-of-
words.
词语包
DataSet
:
该数据集包含了
5
个文本集合,
p>
每个文本集合以词语包的形式
展现。
20.
Balance
Scale
: Balance scale weight & distance
database
天平
DataSet
:天平的重量和距离数据库。
21.
Balloons
: Data previously
used in cognitive psychology experiment; 4
data sets represent different
conditions of an experiment
气球
DataSet
:曾经用在认知心理学实验中的数据;
4<
/p>
个数据集代表了一个实验
中的不同条件。
22.
Blood Transfusion
Service Center
: Data taken from the
Blood
Transfusion Service Center in
Hsin-Chu City in Taiwan -- this is a
classification
problem.
输血服务中心
DataSet
:来自台湾的<
/p>
Hsin-CHu
市的输血服务中心的数据——用
以解决分类问题。
23.
Breast Cancer
: Breast Cancer
Data (Restricted Access)
乳腺癌
DataSet
:乳腺癌数据(访问限制)。
24.
Breast Cancer Wisconsin
(Diagnostic)
: Diagnostic Wisconsin
Breast
Cancer Database
乳腺癌威斯
康星洲(诊断数据)
DataSet
:威斯康星的乳腺癌诊断数
据。
25.
Breast
Cancer Wisconsin (Original)
: Original
Wisconsin Breast Cancer
Database
乳腺癌威斯康星洲(原始数据):原始的威斯康星州乳腺癌数据库。
26.
Breast Cancer Wisconsin
(Prognostic)
: Prognostic Wisconsin
Breast
Cancer Database
乳腺癌威斯
康星洲(
Prognostic
版):威斯康星州乳腺癌数据库
。
27.
Breast
Tissue
: Dataset with electrical
impedance measurements of
freshly
excised tissue samples from the breast.
乳腺组织
DataSet
:乳腺的新鲜切除组织样本的电阻度
量数据集。
28.
CalIt2
Building People Counts
: This data comes
from the main door of
the CalIt2
building at UCI.
Calt2
建筑的人数:
该数据集来自
UCI
的
Calts
p>
建筑的主要大门。
29.
Car Evaluation
: Derived from
simple hierarchical decision model, this
database may be useful for testing
constructive induction and structure
discovery methods.
汽车评估
DataSet
:
来源于简单层次决策模型,
p>
该数据集可用于测试建设性的回
归,和发现结构性方法。
30.
Cardiotocography
: The
dataset consists of measurements of fetal heart
rate (FHR) and uterine contraction (UC)
features on cardiotocograms
classified
by expert obstetricians.
胎儿心率
DataSet
:该数据集包括胎儿心率(
FHR
),和基于产科专家医生分类
的
cardioto
cograms
子宫收缩(
UC
p>
)特征。
31.
Census Income
: Predict
whether income exceeds $$50K/yr based on
census data. Also known as
收
入普查
DataSet
:基于普查数据,预测收入是否超过
p>
50000
美元
/
年。也被称
为“成人”数据集。
32.
Census-Income
(KDD)
: This data set contains weighted
census data
extracted from the 1994 and
1995 current population surveys conducted by the
U.S. Census Bureau.
收入普查(
KDD
)
DataSet
:这个数据集包含了从
1994
-
1995
年的
U.S
普查局
的《当前人口调查》中提取出来的普查数据。
33.
Challenger USA Space
Shuttle O-Ring
: Task: predict the
number of
O-rings that experience
thermal distress on a flight at 31 degrees F given
data
on the previous 23 shuttle flights
挑战者号
USA
航天飞机
O
形圈
DataSet
:任
务:基于前
23
次飞行数据,预测
在一
次
31
度热压
F
的状况中的飞行任务的
O
形圈的数目。
34.
Character
Trajectories
: Multiple, labelled
samples of pen tip trajectories
recorded whilst writing individual
characters. All samples are from the same
writer, for the purposes of primitive
extraction. Only characters with a single
pen-down segment were considered.
字符轨迹
DataSet
:
同时写出单个字幕的笔尖轨道的多个标记样本记录。
为了保
证
初始的提取数据,
所有的样本都来自于同一个书写人员。
仅仅考
虑了单一落笔
段的字符。
35.
Chess (Domain Theories)
: 6
different domain theories for generating
legal moves of chess
国际象棋(域理
论)
DataSet
:产生国际象棋的规定路数的
6
个不同的域理论。
36.
Chess (King-Rook vs.
King)
: Chess Endgame Database for White
King
and Rook against Black King (KRK).
国际象棋(王
RookVS
王)
DataSet
:白国王与黑国王的象棋残局数据库。
37.
Chess (King-Rook
vs. King-Knight)
: Knight Pin Chess End-
Game
Database Creator
国际象棋(王
Rook
对战骑士):骑士
38.
Chess (King-Rook vs.
King-Pawn)
: King+Rook versus King+Pawn
on a7
(usually abbreviated KRKPA7).
国王
Rook
与国王
Pawn
的
a7
(通常简写为
KAEPA7
)。
39.
Cloud
: Little
Documentation
小文档。
40.
CMU Face
Images
: This data consists of 640 black
and white face images
of people taken
with varying pose (straight, left, right, up),
expression (neutral,
happy, sad,
angry), eyes (wearing sunglasses or not), and size
CMU
人脸图像
DataSet
:
该数据集包含了
640
张黑白人脸图像,
并且有直、
左、
右、上四个角度,中性、高兴、悲伤、生气四个表情,有的戴着太阳镜,有的没
有,并且
大小也不一。
41.
Coil
1999 Competition Data
: This data set is
from the 1999
Computational
Intelligence and Learning (COIL) competition. The
data
contains measurements of river
chemical concentrations and algae densities.
Coil1999
竞赛数据:
该数据集来自
1999
年的计算机智能学习竞赛
(简写为<
/p>
Coil
)
。
该
数据集包含了河流的化学浓度度量和藻类的密度度量。
42.
Communities and Crime
:
Communities within the United States. The data
combines socio-economic data from the
1990 US Census, law enforcement
data
from the 1990 US LEMAS survey, and crime data from
the 1995 FBI
UCR.
社区与犯罪
DataSet
:美国的社区。该数据集包含了来自
1990
美国普查的社会
经济数据、
来自
1990
美国
LEMAS
调查的法律实施数据,
还有来自
1995
年
FBI
UCR
的犯罪数据。
43.
Communities and Crime
Unnormalized
: Communities in the US.
Data
combines socio-economic data from
the '90 Census, law enforcement data
from the 1990 Law Enforcement
Management and Admin Stats survey, and
crime data from the 1995 FBI UCR
社区和非标准化犯罪
DataSet
:美国的社区。
数据包含了来自
90
年代普查的社
会经
济数据、来自
1990
年法律实施管理调查的法律实施数据,还
有来自
1995
年
FBI
UCR
的犯罪数据。
44.
Computer Hardware
: Relative
CPU Performance Data, described in
terms of its cycle time, memory size,
etc.
计算机硬件:相关
CPU
运
行数据,采用它的时间周期、内存大小来描述。
45.
Concrete Compressive
Strength
: Concrete is the most
important
material in civil
engineering. The concrete compressive strength is
a highly
nonlinear function of age and
ingredients.
混凝土抗压强度
DataSet
:
混凝土是土木工程中最重要的材料。
抗压强度是混凝
土年龄与组成非线性特征。
46.
Concrete Slump
Test
: Concrete is a highly complex
material. The slump
flow of concrete is
not only determined by the water content, but that
is also
influenced by other concrete
ingredients.
混凝土塌方度试验:
混凝土是一种
非常复杂的材料。
它的塌落度流量不仅取决于
含水量,也受其他
具体成分的影响。
47.
Congressional Voting
Records
: 1984 United Stated
Congressional
Voting Records; Classify
as Republican or Democrat
国会投票记录
DataSet
:
1984
年
美国国会投票记录;按照共和党与民主党分类。
48.
Connect-4
: Contains
connect-4 positions
连接
4
:包含了连接
4
的位置。
49.
Connectionist Bench
(Nettalk Corpus)
: The file
list of 20,008 English words, along
with a phonetic transcription for each word.
The task is to train a network to
produce the proper phonemes
连接工作台(
Nettalk
资料库):文件“
”包含了一个有
20008
个英
语单词的列表,还有一个每个单词的
phonetic
副本。
任务是训练一个网络,用
来产生适当的
phonemes
。
50.
Connectionist Bench (Sonar, Mines vs.
Rocks)
: The task is to train a
network to discriminate between sonar
signals bounced off a metal cylinder
and those bounced off a roughly
cylindrical rock.
连接工作台(声纳、矿产和岩石):目标是训练
一个网络,用来区别在金属圆柱
体的反弹声纳信号,和在基本为圆柱体的岩石上的反弹信
号。
51.
Connectionist Bench (Vowel Recognition
- Deterding Data)
: Speaker
independent recognition of the eleven
steady state vowels of British English
using a specified training set of lpc
derived log area ratios.
连接工作台
(元音识别—
Detering
数据)
:
使用一个来源于一个比率的指定训练
集的
11
个英式英语的稳定元音字母的独立识别扬声器。
52.
Contraceptive Method
Choice
: Dataset is a subset of the 1987
National
Indonesia Contraceptive
Prevalence Survey.
避孕方法的选择:
该
数据集是
1997
年印度尼西亚全国的避孕患病率调查的的一<
/p>
个子集。
53.
Corel Image Features
: This
dataset contains image features extracted
from a Corel image collection. Four
sets of features are available based on the
color histogram, color histogram
layout, color moments, and co-occurrence
Corel
图像特征:该数据集包含了提取自一个
Core
l
图像集合的图片特征。基于
颜色直方图、颜色直方图布局、颜
色的时机和调和,可得到四个特征集合。
54.
Covertype
: Forest CoverType
dataset
覆盖类型:森林覆盖类型数据集。
55.
Credit
Approval
: This data concerns credit
card applications; good mix of
attributes
信贷审批:该数据集与信用卡的使用相关;是各种属性的集合。
56.
Cylinder
Bands
: Used in decision tree induction
for mitigating process
delays known as
气缸带:使用判定树来归纳,减缓气缸带的凸版打印。
57.
Demospongiae
:
Marine sponges of the Demospongiae class
classification
domain.
Demos
pongiae
类别下的海绵分类域。
58.
Dermatology
:
Aim for this dataset is to determine the type of
Eryhemato-Squamous Disease.
皮肤科:该数据集用于判定
Eryhemato
鳞状疾病的类型
。
59.
Dexter
: DEXTER is a text
classification problem in a bag-of-word
representation. This is a two-class
classification problem with sparse
continuous input variables. This
dataset is one of five datasets of the NIPS
2003 feature selection challenge.
DETEX
是一个用一个文字包来表
现的文本分类问题。这是一个通过不断的输入
参数的两层的分类问题。
< br>该数据集是
NIPS2003
年特征提取邀请赛的五个数
据集
中的一个。
60.
DGP2 - The Second Data
Generation Program
: Generates
application
domains based on specific
parameters, number of features, and proportion of
positive to negative examples
DGP2
—第二个数据生成程序:基于具体的参数、特征的数量、和正面到负面例<
/p>
子的比率,产生应用域。
61.
Diabetes
: This diabetes
dataset is from AIM '94
糖尿病:该糖尿病数据集来自
p>
AIM94
。
62.
Document
Understanding
: Five concepts, expressed
as predicates, to be
learned
文件理解:要学习的五个概念,作为谓词来表现。
63.
Dodgers Loop
Sensor
: Loop sensor data was collected
for the Glendale
on ramp for the 101
North freeway in Los Angeles
Dodgers
回路传感器:
回路传感器数据集来自
Gled
ale
的斜坡
(在洛杉矶的
101
p>
个北高速公路)。
64.
Dorothea
: DOROTHEA is a drug
discovery dataset. Chemical compounds
represented by structural molecular
features must be classified as active
(binding to thrombin) or inactive. This
is one of 5 datasets of the NIPS 2003
feature selection challenge.
Dorothea
是一个药物发现数据集。以结构分析特征来表现的化合物必须分类为
活性的
(绑定到凝血酶)
或者非活性的
。
这是五个
NIPS2003
特征选择
挑战赛数
据集中的一个。
65.
E. Coli Genes
: Data giving
characteristics of each ORF (potential gene) in
the E. coli genome. Sequence, homology
(similarity to other genes) and
structural information, and function
(if known) are provided.
大肠杆菌基因:
每个在
基因组里面
ORD(<
/p>
潜在基因
)
的特征数据集。
提供序
列、同源性(与其他基因的相似形)和结构信息。还有功能(如果知道
的话)。
66.
EBL
Domain Theories
: Assorted small-scale
domain theories
EBL
域理论:各种小规模的域理论。
67.
Echocardiogram
: Data for
classifying if patients will survive for at least
one year after a heart attack
超声心动图:该数据集用来分类是否病人在一次心脏病后,至少可以存活一年。
68.
Ecoli
: This
data contains protein localization sites
该数据集包含了蛋白质本地化地址。
69.
Economic
Sanctions
: Domain Theory on Economic
Sanctions;
Undocumented
经济制裁:经济制裁方面的域理论,无记录文档。
70.
EEG Database
:
This data arises from a large study to examine EEG
correlates of genetic predisposition to
alcoholism. It contains measurements
from 64 electrodes placed on the scalp
sampled at 256 Hz
EEG
数据库:
该数据集来源于一个检查
EEG
的、
与易患酒精中毒的基因体质相
关的大型研究、包含了放在头皮上的、为<
/p>
256HZ
的、来自
64
个电极的度量。
71.
El Nino
: The data set
contains oceanographic and surface meteorological
readings taken from a series of buoys
positioned throughout the equatorial
Pacific.
厄尔尼诺:
该数据
集包含了从整个赤道太平洋的一系列浮标的海洋与地面气象读
数。
72.
Entree Chicago
Recommendation Data
: This data contains
a record of
user interactions with the
Entree Chicago restaurant recommendation system. <
/p>
芝加哥主菜推荐数据:
该数据集包含了一个与芝加哥主菜馆的推荐
系统的用户交
互的记录。
73.
Flags
: From Collins Gem
Guide to Flags, 1986
标志:从柯林斯宝石指南的标志,
1986
74.
Forest Fires
: This is a
difficult regression task, where the aim is to
predict
the burned area of forest
fires, in the northeast region of Portugal, by
using
meteorological and other data
(see details at:
/~pcortez/forestfires
).
森林火灾:
这是一个艰难的回归的任务,
其目的
是在葡萄牙东北部地区,
利用气象数据和其
他数据,
预测森林火灾的过火面积,
(详见:
PT /
pcortez /
forestfires
)
。
75.
Function
Finding
: Cases collected mostly from
investigations in physical
science;
intention is to evaluate function-finding
algorithms
寻找功能:收集的情况下,大多是从在物理科学的调查
;
意图是评价函数发现算法
76.
Gisette
:
GISETTE is a handwritten digit recognition
problem. The problem
is to separate the
highly confusible digits '4' and '9'. This dataset
is one of five
datasets of the NIPS
2003 feature selection challenge.
Gisette
:
GISETTE
是一个手写数字识别问题。问题是独立的高度
confusible
数字
'4'
和
'9'<
/p>
。这
个数据集是
5 NIPS
的
2003
年特征选择挑战的数据集之一。
77.
Glass
Identification
: From USA Forensic
Science Service; 6 types of
glass;
defined in terms of their oxide content (i.e. Na,
Fe, K, etc)
玻璃鉴定:从美国法医科学服务
;
6
种玻璃
;
在他们的氧化物含量定义(
即钠,铁,钾等)
78.
Haberman's Survival
: Dataset
contains cases from study conducted on
the survival of patients who had
undergone surgery for breast cancer
哈伯曼
的生存:
DataSet
包含谁经历了乳腺癌手术患者的生存所
进行的研究情况
79.
Hayes-Roth
: Topic: human
subjects study
海斯
-
罗斯:主题:人类受试者的研究
80.
Heart
Disease
: 4 databases: Cleveland,
Hungary, Switzerland, and the VA
Long
Beach
心脏病:
4
个数据库:克
利夫兰,匈牙利,瑞士,和弗吉尼亚州的长滩
81.
Hepatitis
: From : CMU;
Mostly Boolean or numeric-valued
attribute types; Includes cost data
(donated by Peter Turney)
肝炎:从
G.
龚:债务工具中央结算系统
;
大多是布尔值或数字值的属性类型,包括成本数据
(彼得特尼捐赠)
82.
Hill-
Valley
: Each record represents 100
points on a two-dimensional
graph. When
plotted in order (from 1 through 100) as the Y co-
ordinate, the
points will create either
a Hill (a
?
bump
?
in the terrain) or a Valley (a
?
dip
?
in
the terrain).
希尔谷:每个记录代表一
个二维图形上
100
点。当策划,以统筹的
Y
(从
1
到
100
),积分
将创建一个山(在凹凸的地形)或谷(浸在地
形)。
83.
Horse
Colic
: Well documented attributes; 368
instances with 28 attributes
(continuous, discrete, and nominal);
30% missing values
马绞痛:有据可查的属性
; 368
28
属性(连续,离散的,标称值)的实例
;
30
%的缺失值
84.
Housing
: Taken from StatLib
library
房屋:两者
StatLib
< br>库
85.
ICU
: Data set prepared for
the use of participants for the 1994 AAAI Spring
Symposium on Artificial Intelligence in
Medicine.
ICU
的数据集,为
1994
年
AAAI
春季研讨会的
与会者在医学上使用人工智能准备。
86.
Image Segmentation
: Image
data described by high-level numeric-valued
attributes, 7 classes
图像分割:由
高层次的数字值属性描述的图像数据,
7
类
87.
Insurance Company
Benchmark (COIL 2000)
: This data set
used in the
CoIL 2000 Challenge
contains information on customers of an insurance
company. The data consists of 86
variables and includes product usage data
and socio-demographic data
保
险公司的基准
(线圈
2000
年)
p>
:
使用该数据集在线圈
2000
挑战包含保险公司对客户的信
息。该数据由
86<
/p>
变数,包括产品使用的数据和社会人口数据
88.
Internet
Advertisements
: This dataset represents
a set of possible
advertisements on
Internet pages.
互联网广告:这个
Data
Set
表示一组可能在互联网上的网页广告。
89.
Internet Usage
Data
: This data contains general
demographic information
on internet
users in 1997.
互联网应用的数据:该数据包含一般的互联网用户在<
/p>
1997
年的人口统计信息。
90.
Ionosphere
:
Classification of radar returns from the
ionosphere
电离层:从电离层雷达回波分类
91.
IPUMS Census
Database
: This data set contains
unweighted PUMS
census data from the
Los Angeles and Long Beach areas for the years
1970,
1980, and 1990.
IPUMS<
/p>
普查数据库:该数据集包含未加权
PUMS
普查从洛杉矶和长滩地区
1970
年,
1980
年和
1990
年的数据。<
/p>
92.
Iris
: Famous database; from
Fisher, 1936
光圈:著名的数据库
;
从
1936
年费舍尔,
93.
ISOLET
: Goal:
Predict which letter-name was spoken--a simple
classification task.
ISOLET<
/p>
:目标:预测字母名称是口语
-
一个简单的分类任务。
94.
Japanese Credit Screening
:
Includes domain theory (generated by
talking to Japanese domain experts);
data in Lisp
日本信用筛选:包括域理论(日本领域的专家交谈生成)<
/p>
;
在
Lisp
中
的数据
95.
Japanese
Vowels
: This dataset records 640 time
series of 12 LPC
cepstrum coefficients
taken from nine male speakers.
日本元音:该数据集的记录
640 12
的
LPC
倒谱系系数从九男扬声器的时间序列。
96.
KDD Cup 1998
Data
: This is the data set used for The
Second
International Knowledge
Discovery and Data Mining Tools Competition, which
was held i
n
conjunction with KDD-98
KDD
杯
1998
年的数据:
这是数据集的第二
届国际知识发现和数据挖掘工具的竞争,
这是在
同时举行的
p>
KDD - 98
97.
KDD Cup 1999 Data
: This is
the data set used for The Third International
Knowledge Discovery and Data Mining
Tools Competition, which was held in
conjunction with KDD-99
KDD<
/p>
杯
1999
年的数据:
< br>这是数据集使用的第三次国际知识发现和数据挖掘工具的竞争,
这
是在同时举行的
KDD - 99
98.
Kinship
:
Relational dataset
亲属关系:关系数据集
99.
Labor Relations
: From
Collective Bargaining Review