树¶
树¶
Tree dataclass
¶
Tree(root: AbstractNode)
plot ¶
plot(
dataspec: DataSpecification,
max_depth: Optional[int],
label_classes: Optional[Sequence[str]],
options: Optional[PlotOptions] = None,
d3js_url: str = "https://d3js.cn/d3.v6.min.js",
) -> TreePlot
绘制决策树。
参数
名称 | 类型 | 描述 | 默认值 |
---|---|---|---|
dataspec
|
DataSpecification
|
树的 dataspec。 |
必需 |
max_depth
|
Optional[int]
|
绘制的最大树深度。设置为 None 表示完整深度。 |
必需 |
label_classes
|
Optional[Sequence[str]]
|
对于分类,数据集的标签类别。 |
必需 |
options
|
Optional[PlotOptions]
|
绘制的高级选项。设置为 None 表示默认样式。 |
None
|
d3js_url
|
str
|
用于加载 d3.js 库的 URL。 |
'https://d3js.cn/d3.v6.min.js'
|
返回值
类型 | 描述 |
---|---|
TreePlot
|
显示树的 HTML 内容。 |
条件¶
AbstractCondition dataclass
¶
NumericalHigherThanCondition dataclass
¶
CategoricalIsInCondition dataclass
¶
CategoricalSetContainsCondition dataclass
¶
CategoricalSetContainsCondition(
missing: bool,
score: float,
attribute: int,
mask: Sequence[int],
)
Bases: AbstractCondition
形式为 "attribute intersect mask != empty" 的条件。
属性
attribute:条件测试的属性。 mask:排序的掩码值。
DiscretizedNumericalHigherThanCondition dataclass
¶
DiscretizedNumericalHigherThanCondition(
missing: bool,
score: float,
attribute: int,
threshold_idx: int,
)
Bases: AbstractCondition
形式为 "attribute >= bounds[threshold]" 的条件。
属性
attribute:条件测试的属性。 threshold_idx:dataspec 中阈值的索引。
IsMissingInCondition dataclass
¶
IsTrueCondition dataclass
¶
NumericalSparseObliqueCondition dataclass
¶
NumericalSparseObliqueCondition(
missing: bool,
score: float,
attributes: Sequence[int],
weights: Sequence[float],
threshold: float,
)
Bases: AbstractCondition
形式为 "attributes * weights >= threshold" 的条件。
属性
attributes:条件测试的属性。 weights:每个属性的权重。 threshold:条件的阈值。
节点¶
AbstractNode ¶
Leaf dataclass
¶
Leaf(value: AbstractValue)
NonLeaf dataclass
¶
NonLeaf(
value: Optional[AbstractValue] = None,
condition: Optional[AbstractCondition] = None,
pos_child: Optional[AbstractNode] = None,
neg_child: Optional[AbstractNode] = None,
)
Bases: AbstractNode
值¶
RegressionValue dataclass
¶
Bases: AbstractValue
回归树的回归值。
也可用于分类和排序的梯度提升树。
属性
value:树的值。其语义取决于树:对于回归随机森林和回归 GBDT,此值是与标签单位相同的回归值。对于分类和排序 GBDT,此值是 logit。 standard_deviation:附加到值的可选标准差。