IDmRandomForest.ForestSize

Синтаксис

ForestSize: Integer;

Описание

Свойство ForestSize определяет число деревьев в случайном лесе.

Комментарии

Допустимые значения в диапазоне: [1; ∞).

Значение по умолчанию: «100».

Примеры

Для выполнения примера в репозитории предполагается наличие:

Добавьте ссылки на системные сборки: Metabase, Ms, Report, Stat, Tab, Ui.

Sub UserRandFor;
Var
    mb: IMetabase;
    TableDS: IDmTableDataSource;
    ReportDS: IDmReportDataSource;
    Method: IDmMethod;
    Report: IPrxReport;
    Shs: IPrxSheets;
    Sheet: ITabSheet;
    RandFor: IDmRandomForest;
    Binning: IDmField;
    i: Integer;
    Attrs: Array 
Of Integer;
    Target: IUiCommandTarget;
    Reports: IDmReports;
    DmReport: IDmReport;
Begin
    mb := MetabaseClass.Active;
    
// Создаем табличный источник данных
    TableDS := (New TableDataSource.Create) As IDmTableDataSource;
    
// Указываем таблицу-источник
    TableDS.Table := mb.ItemByID("DM_TABLE").Bind;
    
// Указываем, что данные расположены в столбцах таблицы
    TableDS.DataInColumns := True;
    
// Создаем источник данных, являющийся регламентным отчётом
    ReportDS := (New ReportDataSource.Create) As IDmReportDataSource;
    
// Получаем регламентный отчёт
    Report := mb.ItemByID("DM_REPORT_RES").Edit As IPrxReport;
    Shs := Report.Sheets;
    Shs.Clear;
    
// Создаем страницу для выгрузки результатов
    Sheet := (Shs.Add("", PrxSheetType.Table) As IPrxTable).TabSheet;
    
// Указываем страницу, на которую будут выгружены данные    
    ReportDS.TabSheet := Sheet;
    
// Указываем диапазон данных
    ReportDS.Range := Sheet.Cell(00);
    ReportDS.AddResultColumn(
"Категория");
    
// Создаем метод расчёта
    Method := (New DataMiningMethod.Create) As IDmMethod;
    
// Указываем тип метода
    Method.Kind := DmMethodKind.RandomForest;
    
// Задаем входной источник данных
    Method.InputDataSource := TableDS;
    
// Задаем приёмник данных
    Method.OutputDataSource := ReportDS;
    
// Настраиваем параметры метода расчёта
    RandFor := Method.Details As IDmRandomForest;
    
// Размер леса
    RandFor.ForestSize := 20;
    RandFor.LearningSamplePortion := 
0.6;
    
// Количество признаков
    RandFor.NumberOfPredictors := 2;
    
//Размер деревьев
    RandFor.TreeSizeSpecification.MaximumNumberOfLevels := 10;
    RandFor.TreeSizeSpecification.MinimumNumberOfCases := 
2;
    
// Рассматриваем каждую категорию как отдельный признак
    RandFor.TreeSizeSpecification.ReduceCategories := True;
    
// Указываем столбец для анализа
    RandFor.Target := TableDS.FieldCount - 1;
    Debug.WriteLine(
"Столбец для анализа ключевых факторов влияния:");
    Debug.WriteLine(
" - " + TableDS.Field(RandFor.Target).Name);
    
// Задаем факторы, влияющие на анализ
    Attrs := New Integer[TableDS.FieldCount - 2];
    Debug.WriteLine(
"Факторы, влияющие на анализ:");
    
For i := 0 To Attrs.Length - 1 Do
        Attrs[i] := i + 
1;
        Binning := TableDS.Field(i + 
1);
        Debug.WriteLine(Binning.Index.ToString + 
". " + Binning.Name);
        Debug.Indent;
        
// Задаем параметры процедуры Binning
        If Binning.IsNumerical Then
            Binning.BinningType := BinningMethod.EqualDepth;
            Binning.CategoriesCount := 
4;
            Binning.TreatNanAsCategory := 
False;
            Debug.WriteLine(
"количество непустых значений: " + Binning.NonEmptyCount.ToString);
        
End If;
        
Select Case Binning.FieldType
            
Case DmFieldType.Date: Debug.WriteLine("тип данных: дата");
            
Case DmFieldType.Integer: Debug.WriteLine("тип данных: целочисленные");
            
Case DmFieldType.Numeric: Debug.WriteLine("тип данных: числовые");
            
Case DmFieldType.String: Debug.WriteLine("тип данных: строковые");
        
End Select;
        Debug.WriteLine(
"источник данных: " + Binning.DataSource.Caption);
        
Select Case Binning.ExplanatoryType
            
Case DmExplanatoryType.Continuous: Debug.WriteLine("тип фактора: количественный");
            
Case DmExplanatoryType.Ordered: Debug.WriteLine("тип фактора: порядковый");
            
Case DmExplanatoryType.Categorical: Debug.WriteLine("тип фактора: категориальный");
        
End Select;
        Debug.Unindent;
    
End For;
    RandFor.Attributes := Attrs;
    
// Выполняем анализ и выгружаем результаты
    Reports := Method.Execute;
    DmReport := reports.FindByType(DmReportType.Forest);
    ReportDS := DmReport.Generate;
    Debug.WriteLine(
"Заголовок отчета: " + DmReport.Caption);
    Debug.WriteLine(
"Вид анализа: " + RandFor.DisplayName);
    ReportDS.TabSheet.View.Selection.SelectAll;
    ReportDS.TabSheet.View.Selection.Copy;
    Sheet.Table.Paste;
    Sheet.Columns(
01).AdjustWidth;
    Sheet.Rows(
01).AdjustHeight;
    Report.Sheets.Item(
0).Name := ReportDS.Caption;
    (Report 
As IMetabaseObject).Save;
    
// Открываем регламентный отчёт, содержащий результаты анализа
    Target := WinApplication.Instance.GetObjectTarget(Report As IMetabaseObject);
    Target.Execute(
"Object.Open"Null);
End Sub UserRandFor;

В результате выполнения процедуры для данных из таблицы DM_TABLE будет выполнен интеллектуальный анализа данных алгоритмом «Случайный лес» метода «Ансамбли деревьев решений» с применением процедуры Binning для числовых данных. Параметры анализа будут выведены в окно консоли. Результаты анализа будут выгружены в отчёт DM_REPORT_RES.

См. также:

IDmRandomForest