##在这里插入图片描述

在数据处理和分析中,我们经常遇到这样的问题:

如何过滤出指定范围内的数据?
如何去除异常值,保留正常范围内的数据?
如何快速识别超出范围的数据点?

数据范围过滤分析 (Data Range Filter Analysis) 是数据处理的基础工具,通过指定最小值和最大值范围,过滤数据序列,保留范围内的数据,去除异常值,用于数据清洗和异常检测。
本案例基于 Kotlin Multiplatform(KMP)与 OpenHarmony,实现了一个数据范围过滤分析器

  • 范围过滤:根据指定的最小值和最大值范围,过滤数据序列;
  • 过滤统计:统计过滤后的数据数量、过滤掉的数据数量和保留率;
  • 过滤详情:展示每个数据点的过滤状态(保留或过滤);
  • 过滤后统计:提供过滤后数据的基本统计信息;
  • 通过 ArkTS 单页面展示原始序列、过滤后序列、被过滤的数据和过滤详情,帮助你直观理解数据范围过滤效果。

一、问题背景与典型场景

典型场景包括:

  1. 异常值过滤
    过滤掉超出合理范围的异常值(如异常响应时间、异常资源使用率),保留正常范围内的数据用于分析。

  2. 数据清洗
    在数据预处理阶段,通过范围过滤去除不合理的数据点,提高数据质量。

  3. 阈值告警
    识别超出阈值范围的数据点,用于告警和异常检测。

  4. 数据筛选
    根据业务需求,筛选出指定范围内的数据,用于后续分析。

  5. 质量控制
    在数据采集和处理中,通过范围过滤确保数据在合理范围内,用于质量控制。

相比保留所有数据,数据范围过滤的优势在于:

  • 去除异常值,提高数据质量;
  • 保留正常范围内的数据,便于分析;
  • 快速识别超出范围的数据点;
  • 支持数据清洗和质量控制。

二、Kotlin 数据范围过滤引擎

1. 输入格式设计

本案例支持范围配置:

min=12
max=18
series=10,12,11,13,15,18,20,19,17

其中:

  • min:最小值(包含)
  • max:最大值(包含)
  • series:待过滤的数值序列
2. 核心算法实现

App.kt 中,我们实现了 dataRangeFilterAnalyzer 函数:

@JsExport
fun dataRangeFilterAnalyzer(inputData: String): String {
    // 1. 解析输入序列、最小值和最大值
    val values = parseSeries(inputData)
    val minValue = parseMin(inputData)
    val maxValue = parseMax(inputData)
    
    // 2. 验证范围
    if (minValue > maxValue) {
        return "❌ 最小值不能大于最大值"
    }
    
    // 3. 过滤数据
    val filtered = values.filter { it >= minValue && it <= maxValue }
    val filteredOut = values.filter { it < minValue || it > maxValue }
    
    // 4. 计算统计信息
    val filterRate = (filtered.size.toDouble() / values.size) * 100.0
    
    // 5. 生成报告
    return buildReport(...)
}
3. 关键处理逻辑

范围过滤

  • 使用 filter 方法过滤数据
  • 保留满足 minValue <= value <= maxValue 的数据
  • 时间复杂度:O(n),空间复杂度:O(n)

过滤统计

  • 计算过滤后的数据数量
  • 计算过滤掉的数据数量
  • 计算保留率(过滤后数量 / 原始数量 * 100%)

三、OpenHarmony ArkTS 前端集成

1. 导入 Kotlin/JS 函数

index.ets 中导入:

import { dataRangeFilterAnalyzer } from './hellokjs'
2. 状态变量定义
@State minInput: string = "12"
@State maxInput: string = "18"
@State seriesInput: string = "10,12,11,13,15,18,20,19,17"
@State result: string = ""
@State isLoading: boolean = false
3. 执行分析逻辑
executeDemo() {
  this.isLoading = true
  
  const minLine = `min=${this.minInput}`
  const maxLine = `max=${this.maxInput}`
  const seriesLine = this.seriesInput.includes('series=') 
    ? this.seriesInput 
    : `series=${this.seriesInput}`
  const payload = `${minLine}\n${maxLine}\n${seriesLine}`
  
  setTimeout(() => {
    try {
      this.result = dataRangeFilterAnalyzer(payload)
    } catch (e) {
      this.result = "❌ 执行失败: " + e.message
    }
    this.isLoading = false
  }, 100)
}
4. UI 布局设计
  • 顶部标题栏:使用渐变背景(青色-蓝色主题),展示"数据范围过滤分析"标题
  • 输入区域
    • 最小值输入(min=12)
    • 最大值输入(max=18)
    • 序列输入框,支持 series=... 格式或直接输入数值序列
  • 执行按钮:运行分析按钮和重置按钮
  • 结果展示区:使用 Scroll 组件展示分析报告,包括原始序列、过滤后序列、被过滤的数据和过滤详情

四、算法复杂度分析

  • 时间复杂度:O(n),其中 n 为序列长度。需要遍历序列一次进行过滤。
  • 空间复杂度:O(n),需要存储原始序列、过滤后的序列和被过滤的序列。

五、工程化应用建议

  1. 异常值过滤
    过滤掉超出合理范围的异常值,保留正常范围内的数据用于分析。

  2. 数据清洗
    在数据预处理阶段,通过范围过滤去除不合理的数据点,提高数据质量。

  3. 阈值告警
    识别超出阈值范围的数据点,用于告警和异常检测。

  4. 范围设置

    • 最小值:根据业务需求设置合理的最小值
    • 最大值:根据业务需求设置合理的最大值
    • 范围应该覆盖正常数据的范围,排除异常值
  5. 保留率分析

    • 保留率反映了数据在指定范围内的比例
    • 保留率过低,说明范围设置可能过窄
    • 保留率过高,说明范围设置可能过宽

六、总结

数据范围过滤分析是数据处理的基础工具,通过指定最小值和最大值范围,过滤数据序列,保留范围内的数据,去除异常值,用于数据清洗和异常检测。本案例展示了如何在 KMP + OpenHarmony 架构下实现一个轻量级的数据范围过滤分析器,适用于异常值过滤、数据清洗、阈值告警等场景。

核心优势

  • 实现简单,计算高效
  • 结果直观,易于理解
  • 适用广泛,可用于多种场景
  • 支持数据清洗和质量控制

适用场景

  • 异常值过滤
  • 数据清洗
  • 阈值告警
  • 数据筛选
  • 质量控制

通过本案例,你可以快速掌握数据范围过滤分析的核心思想,并在实际项目中灵活应用。

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.csdn.net

Logo

社区规范:仅讨论OpenHarmony相关问题。

更多推荐