ForestSize: Integer;
ForestSize: integer;
Свойство ForestSize определяет число деревьев в случайном лесе.
Доступные значения в диапазоне: [1; ∞).
Значение по умолчанию: 100.
Для выполнения примера в репозитории предполагается наличие таблицы с идентификатором DM_TABLE, содержащей данные для анализа. Также должен присутствовать регламентный отчёт с идентификатором DM_REPORT_RES, в который будут выгружены результаты анализа.
Добавьте ссылки на системные сборки: Metabase, Ms, Report, Stat, Tab, Ui.
Sub UserRandFor;
Var
mb: IMetabase;
TableDS: IDmTableDataSource;
ReportDS: IDmReportDataSource;
Method: IDmMethod;
Report: IPrxReport;
Shs: IPrxSheets;
Sheet: ITabSheet;
RandFor: IDmRandomForest;
Binning: IDmField;
i: Integer;
Attrs: Array Of Integer;
Target: IUiCommandTarget;
Reports: IDmReports;
DmReport: IDmReport;
Begin
mb := MetabaseClass.Active;
// Создаем табличный источник данных
TableDS := (New TableDataSource.Create) As IDmTableDataSource;
// Указываем таблицу-источник
TableDS.Table := mb.ItemByID("DM_TABLE").Bind;
// Указываем, что данные расположены в столбцах таблицы
TableDS.DataInColumns := True;
// Создаем источник данных, являющийся регламентным отчётом
ReportDS := (New ReportDataSource.Create) As IDmReportDataSource;
// Получаем регламентный отчёт
Report := mb.ItemByID("DM_REPORT_RES").Edit As IPrxReport;
Shs := Report.Sheets;
Shs.Clear;
// Создаем страницу для выгрузки результатов
Sheet := (Shs.Add("", PrxSheetType.Table) As IPrxTable).TabSheet;
// Указываем страницу, на которую будут выгружены данные
ReportDS.TabSheet := Sheet;
// Указываем диапазон данных
ReportDS.Range := Sheet.Cell(0, 0);
ReportDS.AddResultColumn("Категория");
// Создаем метод расчёта
Method := (New DataMiningMethod.Create) As IDmMethod;
// Указываем тип метода
Method.Kind := DmMethodKind.RandomForest;
// Задаем входной источник данных
Method.InputDataSource := TableDS;
// Задаем приёмник данных
Method.OutputDataSource := ReportDS;
// Настраиваем параметры метода расчёта
RandFor := Method.Details As IDmRandomForest;
// Размер леса
RandFor.ForestSize := 20;
RandFor.LearningSamplePortion := 0.6;
// Количество признаков
RandFor.NumberOfPredictors := 2;
//Размер деревьев
RandFor.TreeSizeSpecification.MaximumNumberOfLevels := 10;
RandFor.TreeSizeSpecification.MinimumNumberOfCases := 2;
// Рассматриваем каждую категорию как отдельный признак
RandFor.TreeSizeSpecification.ReduceCategories := True;
// Указываем столбец для анализа
RandFor.Target := TableDS.FieldCount - 1;
Debug.WriteLine("Столбец для анализа ключевых факторов влияния:");
Debug.WriteLine(" - " + TableDS.Field(RandFor.Target).Name);
// Задаем факторы, влияющие на анализ
Attrs := New Integer[TableDS.FieldCount - 2];
Debug.WriteLine("Факторы, влияющие на анализ:");
For i := 0 To Attrs.Length - 1 Do
Attrs[i] := i + 1;
Binning := TableDS.Field(i + 1);
Debug.WriteLine(Binning.Index.ToString + ". " + Binning.Name);
Debug.Indent;
// Задаем параметры процедуры Binning
If Binning.IsNumerical Then
Binning.BinningType := BinningMethod.EqualDepth;
Binning.CategoriesCount := 4;
Binning.TreatNanAsCategory := False;
Debug.WriteLine("количество непустых значений: " + Binning.NonEmptyCount.ToString);
End If;
Select Case Binning.FieldType
Case DmFieldType.Date: Debug.WriteLine("тип данных: дата");
Case DmFieldType.Integer: Debug.WriteLine("тип данных: целочисленные");
Case DmFieldType.Numeric: Debug.WriteLine("тип данных: числовые");
Case DmFieldType.String: Debug.WriteLine("тип данных: строковые");
End Select;
Debug.WriteLine("источник данных: " + Binning.DataSource.Caption);
Select Case Binning.ExplanatoryType
Case DmExplanatoryType.Continuous: Debug.WriteLine("тип фактора: количественный");
Case DmExplanatoryType.Ordered: Debug.WriteLine("тип фактора: порядковый");
Case DmExplanatoryType.Categorical: Debug.WriteLine("тип фактора: категориальный");
End Select;
Debug.Unindent;
End For;
RandFor.Attributes := Attrs;
// Выполняем анализ и выгружаем результаты
Reports := Method.Execute;
DmReport := reports.FindByType(DmReportType.Forest);
ReportDS := DmReport.Generate;
Debug.WriteLine("Заголовок отчета: " + DmReport.Caption);
Debug.WriteLine("Вид анализа: " + RandFor.DisplayName);
ReportDS.TabSheet.View.Selection.SelectAll;
ReportDS.TabSheet.View.Selection.Copy;
Sheet.Table.Paste;
Sheet.Columns(0, 1).AdjustWidth;
Sheet.Rows(0, 1).AdjustHeight;
Report.Sheets.Item(0).Name := ReportDS.Caption;
(Report As IMetabaseObject).Save;
// Открываем регламентный отчёт, содержащий результаты анализа
Target := WinApplication.Instance.GetObjectTarget(Report As IMetabaseObject);
Target.Execute("Object.Open", Null);
End Sub UserRandFor;
Imports Prognoz.Platform.Interop.Metabase;
Imports Prognoz.Platform.Interop.Ms;
Imports Prognoz.Platform.Interop.Report;
Imports Prognoz.Platform.Interop.Stat;
Imports Prognoz.Platform.Interop.Tab;
Imports Prognoz.Platform.Interop.Ui;
…
Public Shared Sub Main(Params: StartParams);
Var
mb: IMetabase;
TableDS: IDmTableDataSource;
ReportDS: IDmReportDataSource;
Method: IDmMethod;
Report: IPrxReport;
Shs: IPrxSheets;
Sheet: TabSheet;
RandFor: IDmRandomForest;
Binning: IDmField;
i: Integer;
Attrs: Array Of Integer;
Target: IUiCommandTarget;
Reports: IDmReports;
DmReport: IDmReport;
WinApplication: WinApplicationClassClass = New WinApplicationClassClass();
Begin
mb := Params.Metabase;
// Создаем табличный источник данных
TableDS := (New TableDataSource.Create()) As IDmTableDataSource;
// Указываем таблицу-источник
TableDS.Table := mb.ItemByID["DM_TABLE"].Bind();
// Указываем, что данные расположены в столбцах таблицы
TableDS.DataInColumns := True;
// Создаем источник данных, являющийся регламентным отчётом
ReportDS := (New ReportDataSource.Create()) As IDmReportDataSource;
// Получаем регламентный отчёт
Report := mb.ItemByID["DM_REPORT_RES"].Edit() As IPrxReport;
Shs := Report.Sheets;
Shs.Clear();
// Создаем страницу для выгрузки результатов
Sheet := (Shs.Add("", PrxSheetType.pstTable) As IPrxTable).TabSheet;
// Указываем страницу, на которую будут выгружены данные
ReportDS.TabSheet := Sheet;
// Указываем диапазон данных
ReportDS.Range := Sheet.Cell[0, 0];
ReportDS.AddResultColumn("Категория");
// Создаем метод расчёта
Method := (New DataMiningMethod.Create()) As IDmMethod;
// Указываем тип метода
Method.Kind := DmMethodKind.dmmkRandomForest;
// Задаем входной источник данных
Method.InputDataSource := TableDS;
// Задаем приёмник данных
Method.OutputDataSource := ReportDS;
// Настраиваем параметры метода расчёта
RandFor := Method.Details As IDmRandomForest;
// Размер леса
RandFor.ForestSize := 20;
RandFor.LearningSamplePortion := 0.6;
// Количество признаков
RandFor.NumberOfPredictors := 2;
//Размер деревьев
RandFor.TreeSizeSpecification.MaximumNumberOfLevels := 10;
RandFor.TreeSizeSpecification.MinimumNumberOfCases := 2;
// Рассматриваем каждую категорию как отдельный признак
RandFor.TreeSizeSpecification.ReduceCategories := True;
// Указываем столбец для анализа
RandFor.Target := TableDS.FieldCount - 1;
System.Diagnostics.Debug.WriteLine("Столбец для анализа ключевых факторов влияния:");
System.Diagnostics.Debug.WriteLine(" - " + TableDS.Field[RandFor.Target].Name);
// Задаем факторы, влияющие на анализ
Attrs := New Integer[TableDS.FieldCount - 2];
System.Diagnostics.Debug.WriteLine("Факторы, влияющие на анализ:");
For i := 0 To Attrs.Length - 1 Do
Attrs[i] := i + 1;
Binning := TableDS.Field[i + 1];
System.Diagnostics.Debug.WriteLine(Binning.Index.ToString() + ". " + Binning.Name);
System.Diagnostics.Debug.Indent();
// Задаем параметры процедуры Binning
If Binning.IsNumerical Then
Binning.BinningType := BinningMethod.bmEqualDepth;
Binning.CategoriesCount := 4;
Binning.TreatNanAsCategory := False;
System.Diagnostics.Debug.WriteLine("количество непустых значений: " + Binning.NonEmptyCount.ToString());
End If;
Select Case Binning.FieldType
Case DmFieldType.dftDate: System.Diagnostics.Debug.WriteLine("тип данных: дата");
Case DmFieldType.dftInteger: System.Diagnostics.Debug.WriteLine("тип данных: целочисленные");
Case DmFieldType.dftNumeric: System.Diagnostics.Debug.WriteLine("тип данных: числовые");
Case DmFieldType.dftString: System.Diagnostics.Debug.WriteLine("тип данных: строковые");
End Select;
Select Case Binning.ExplanatoryType
Case DmExplanatoryType.detContinuous: System.Diagnostics.Debug.WriteLine("тип фактора: количественный");
Case DmExplanatoryType.detOrdered: System.Diagnostics.Debug.WriteLine("тип фактора: порядковый");
Case DmExplanatoryType.detCategorical: System.Diagnostics.Debug.WriteLine("тип фактора: категориальный");
End Select;
System.Diagnostics.Debug.WriteLine("источник данных: " + Binning.DataSource.Caption);
System.Diagnostics.Debug.Unindent();
End For;
RandFor.Attributes := Attrs;
// Выполняем анализ и выгружаем результаты
Reports := Method.Execute();
DmReport := reports.FindByType[DmReportType.drtForest];
ReportDS := DmReport.Generate();
System.Diagnostics.Debug.WriteLine("Заголовок отчета: " + DmReport.Caption);
System.Diagnostics.Debug.WriteLine("Вид анализа: " + RandFor.DisplayName);
ReportDS.TabSheet.View.Selection.SelectAll();
ReportDS.TabSheet.View.Selection.Copy();
Sheet.Table.Paste();
Sheet.Columns[0, 1].AdjustWidth(-1, -1);
Sheet.Rows[0, 1].AdjustHeight(-1, -1);
Report.Sheets.Item[0].Name := ReportDS.Caption;
(Report As IMetabaseObject).Save();
// Открываем регламентный отчёт, содержащий результаты анализа
Target := WinApplication.Instance[Null].GetObjectTarget(Report As IMetabaseObject);
Target.Execute("Object.Open", Null, Null);
End Sub;
Результат выполнения процедуры: для данных из таблицы DM_TABLE выполнен интеллектуальный анализа данных алгоритмом «Случайный лес» метода «Ансамбли деревьев решений» с применением процедуры Binning для числовых данных, параметры анализа выведены в окно консоли, результаты анализа выгружены в отчёт DM_REPORT_RES.
См. также: