NumberOfFolds: Integer;
NumberOfFolds: integer;
Свойство NumberOfFolds определяет количество блоков.
Свойство учитывается, если используется кросс-валидация по K блокам, то есть свойство IDmMethodCrossValidation.SamplingType имеет значение CrossValidationSamplingType.Kfold.
Диапазон допустимых значений: [1; количество наблюдений]. Значение по умолчанию: «5».
Для выполнения примера в репозитории предполагается наличие таблицы с идентификатором «DM_TABLE», содержащей данные для анализа.
Добавьте ссылки на системные сборки: Metabase, Ms, Stat.
Sub UserProc;
Var
MB: IMetabase;
ReportDS: IDmReportDataSource;
TableDS: IDmTableDataSource;
Method: IDmMethod;
DM: IDmLogisticRegression;
i, j: Integer;
Attrs: Array Of Integer;
CrossValidation: IDmMethodCrossValidation;
Reports: IDmReports;
DmReport: IDmReport;
CrossValPerf: ICrossValidationPerformanceScores;
CategoriesList, KfoldIntervals: Array Of Integer;
PerformanceMatrix: Array Of Double;
Begin
MB := MetabaseClass.Active;
// Создаем метод расчёта
Method := (New DataMiningMethod.Create) As IDmMethod;
// Указываем тип метода
Method.Kind := DmMethodKind.LogisticRegression;
// Создаем табличный источник данных
TableDS := (New TableDataSource.Create) As IDmTableDataSource;
// Указываем таблицу-источник
TableDS.Table := MB.ItemByID("DM_TABLE").Bind;
// Задаем входной источник данных
Method.InputDataSource := TableDS;
// Создаем источник данных, являющийся регламентным отчётом
ReportDS := (New ReportDataSource.Create) As IDmReportDataSource;
// Задаем приёмник данных
Method.OutputDataSource := ReportDS;
// Настраиваем параметры метода расчёта
DM := Method.Details As IDmLogisticRegression;
// Задаем факторы, влияющие на анализируемый признак
Attrs := New Integer[TableDS.FieldCount - 1];
For i := 0 To Attrs.Length - 1 Do
Attrs[i] := i + 1;
End For;
DM.Attributes := Attrs;
// Указываем анализируемый объект
DM.Target := ReportDS.FieldCount;
// Задаем пороговое значение
DM.Threshold := 0.57;
// Настраиваем параметры кросс-валидации
CrossValidation := DM.CrossValidation;
// Указываем, что кросс-валидация используется
CrossValidation.Active := True;
// Задаем метод кросс-валидации: валидация по K блокам
CrossValidation.SamplingType := CrossValidationSamplingType.Kfold;
// Задаем количество блоков
CrossValidation.NumberOfFolds := 4;
// Выполняем анализ и выгружаем результаты
Reports := Method.Execute;
// Выводим результаты кросс-валидации
DmReport := Reports.FindByType(DmReportType.CrossValidation);
DmReport.Generate;
CrossValPerf := CrossValidation.Results;
Debug.WriteLine("Результаты кросс-валидации:");
Debug.Indent;
Debug.WriteLine("Анализируемый признак: " + CrossValPerf.ClassificatorName);
Debug.Write("Количество факторов, влияющих на анализируемый признак: ");
Debug.WriteLine(CrossValPerf.FactorsNumber);
Debug.WriteLine("Количество наблюдений: " + CrossValPerf.ObservationsNumber.ToString);
Debug.WriteLine("Количество повторений: " + CrossValidation.NumberOfRandomTests.ToString);
Debug.WriteLine("Точность классификации: " + CrossValPerf.ClassificationAccuracy.ToString);
Debug.WriteLine("Категории:");
Debug.Indent;
CategoriesList := CrossValPerf.CategoriesList;
For i := 0 To CategoriesList.Length - 1 Do
Debug.WriteLine(CategoriesList[i]);
End For;
Debug.Unindent;
Debug.WriteLine("Интервалы для блоков:");
Debug.Indent;
KfoldIntervals := CrossValPerf.KfoldIntervals;
For i := 0 To KfoldIntervals.Length - 1 Do
Debug.WriteLine(KfoldIntervals[i]);
End For;
Debug.Unindent;
Debug.WriteLine("Корректная классификация:");
Debug.Indent;
PerformanceMatrix := CrossValPerf.PerformanceMatrix;
For i := 0 To PerformanceMatrix.GetUpperBound(1) Do
For j := 0 To PerformanceMatrix.GetUpperBound(2) Do
Debug.Write(PerformanceMatrix[i, j].ToString + #9);
End For;
Debug.WriteLine("");
End For;
Debug.Unindent;
Debug.Unindent;
End Sub UserProc;
В результате выполнения примера будет выполнена кросс-валидация, её результаты будут выведены в окно консоли.
Необходимые требования и результат выполнения примера Fore.NET совпадают с примером Fore.
Imports Prognoz.Platform.Interop.Ms;
Imports Prognoz.Platform.Interop.Stat;
…
Public Shared Sub Main(Params: StartParams);
Var
MB: IMetabase;
ReportDS: IDmReportDataSource;
TableDS: IDmTableDataSource;
Method: IDmMethod;
DM: IDmLogisticRegression;
i, j: Integer;
Attrs: Array Of Integer;
CrossValidation: IDmMethodCrossValidation;
Reports: IDmReports;
DmReport: IDmReport;
CrossValPerf: ICrossValidationPerformanceScores;
CategoriesList, KfoldIntervals, PerformanceMatrix: System.Array;
Begin
MB := Params.Metabase;
// Создаем метод расчёта
Method := (New DataMiningMethod.Create()) As IDmMethod;
// Указываем тип метода
Method.Kind := DmMethodKind.dmmkLogisticRegression;
// Создаем табличный источник данных
TableDS := (New TableDataSource.Create()) As IDmTableDataSource;
// Указываем таблицу-источник
TableDS.Table := MB.ItemByID["DM_TABLE"].Bind();
// Задаем входной источник данных
Method.InputDataSource := TableDS;
// Создаем источник данных, являющийся регламентным отчётом
ReportDS := (New ReportDataSource.Create()) As IDmReportDataSource;
// Задаем приёмник данных
Method.OutputDataSource := ReportDS;
// Настраиваем параметры метода расчёта
DM := Method.Details As IDmLogisticRegression;
// Задаем факторы, влияющие на анализируемый признак
Attrs := New Integer[TableDS.FieldCount - 1];
For i := 0 To Attrs.Length - 1 Do
Attrs[i] := i + 1;
End For;
DM.Attributes := Attrs;
// Указываем анализируемый объект
DM.Target := ReportDS.FieldCount;
// Задаем пороговое значение
DM.Threshold := 0.57;
// Настраиваем параметры кросс-валидации
CrossValidation := DM.CrossValidation;
// Указываем, что кросс-валидация используется
CrossValidation.Active := True;
// Задаем метод кросс-валидации: валидация по K блокам
CrossValidation.SamplingType := CrossValidationSamplingType.cvstKfold;
// Задаем количество блоков
CrossValidation.NumberOfFolds := 4;
// Выполняем анализ и выгружаем результаты
Reports := Method.Execute();
// Выводим результаты кросс-валидации
DmReport := Reports.FindByType[DmReportType.drtCrossValidation];
DmReport.Generate();
CrossValPerf := CrossValidation.Results;
System.Diagnostics.Debug.WriteLine("Результаты кросс-валидации:");
System.Diagnostics.Debug.Indent();
System.Diagnostics.Debug.WriteLine("Анализируемый признак: " + CrossValPerf.ClassificatorName);
System.Diagnostics.Debug.Write("Количество факторов, влияющих на анализируемый признак: ");
System.Diagnostics.Debug.WriteLine(CrossValPerf.FactorsNumber);
System.Diagnostics.Debug.WriteLine("Количество наблюдений: " + CrossValPerf.ObservationsNumber.ToString());
System.Diagnostics.Debug.WriteLine("Количество повторений: " + CrossValidation.NumberOfRandomTests.ToString());
System.Diagnostics.Debug.WriteLine("Точность классификации: " + CrossValPerf.ClassificationAccuracy.ToString());
System.Diagnostics.Debug.WriteLine("Категории:");
System.Diagnostics.Debug.Indent();
CategoriesList := CrossValPerf.CategoriesList;
For i := 0 To CategoriesList.Length - 1 Do
System.Diagnostics.Debug.WriteLine(CategoriesList[i]);
End For;
System.Diagnostics.Debug.Unindent();
System.Diagnostics.Debug.WriteLine("Интервалы для блоков:");
System.Diagnostics.Debug.Indent();
KfoldIntervals := CrossValPerf.KfoldIntervals;
For i := 0 To KfoldIntervals.Length - 1 Do
System.Diagnostics.Debug.WriteLine(KfoldIntervals[i]);
End For;
System.Diagnostics.Debug.Unindent();
System.Diagnostics.Debug.WriteLine("Корректная классификация:");
System.Diagnostics.Debug.Indent();
PerformanceMatrix := CrossValPerf.PerformanceMatrix;
For i := 0 To PerformanceMatrix.GetUpperBound(1) Do
For j := 0 To PerformanceMatrix.GetUpperBound(0) Do
System.Diagnostics.Debug.Write(PerformanceMatrix[j, i].ToString() + char.ConvertFromUtf32(9));
End For;
System.Diagnostics.Debug.WriteLine("");
End For;
System.Diagnostics.Debug.Unindent();
System.Diagnostics.Debug.Unindent();
End Sub;
См. также: