你写的每一个烂表单，都是由于校验次序搞反了

发布时间：2026-05-09 文章来源：网络浏览次数：266

表单校验的规划逻辑远比想象中更值得沉思。从空值拦截到数据库查重，五层校验架构揭示了数据过滤的黄金法则——本钱越低的检查越应前置。本文将拆解这套源于数据库优化思维的校验范式，揭示前端与后端校验的协同策略，以及如何用一张矩阵表彻底解决开发与测验的交流难题。

上星期review代码，后端搭档写了个新增数据的接口。我点开一看，校验逻辑大概是这么个画风：

先查数据库看有没有重复记录，再校验字段格局，最终才判别必填项有没有传。

我说兄弟，用户连产品名都没填呢，你就去查库了？数据库它也是有爱情的好吧。

他愣了一下：”这有啥区别吗？横竖最终都会报错。”

区别大了。校验能不能拦住脏数据是及格线，校验的次序才是你规划水平的分界线。

这事让我想起之前踩过的一个坑。

咱们体系有个”新增周度数据”的表单——产品、企业、省份、周产值、周库存、价格、本钱、毛利，十几个字段。刚上线那会儿，校验逻辑是前端搭档”凭感觉”写的，想到哪验到哪。

成果呢，用户填了个负数的价格，体系没拦住，直接跑去做毛利核算了。算出来一个离谱的毛利率，存进了数据库。下游的价格剖析模块一读这条数据——Loss预测直接飞了，剖析师第二天跑来问咱们”这个品种是不是出bug了”。

查了半天，便是由于规模校验被放在了相关核算的后边。价格是负数这件事，本来在第三层就该拦住的，成果漏到了第四层，还引发了连锁反应。

一个校验放错方位，链路上一切下游都跟着遭殃。

这事之后我就开端揣摩：表单校验这东西，究竟有没有一套通用的、稳定的规划范式？

还真有。并且特别朴素。

五层过滤，越廉价的检查越先跑

我后来把校验逻辑梳理成了五层。不是我发明的，你去看任何一个老练结构的参数校验，底层逻辑都是这个：

L1 — 存在性：传没传？

最廉价的检查。字段是不是null、空字符串、undefined。带星号的必填项，这一层全覆盖。用户点提交，先扫一遍，没填的直接标红，后边悉数越过。

为什么放第一层？由于一个空值，你去做格局校验没含义，做规模校验更没含义。就好比你拿到一个null去调.length，不是校验失利的问题，是直接NPE给你看。

L2 — 格局类型：像不像？

字段有值了，看看这个值的”形状”对不对。周产值填了”哈哈哈”——类型不对。日期字段收到一个”2026-13-45″——格局不合法。邮箱没有@符号。手机号混进了字母。

这一层实质上是做类型转化前的门卫。过了这关，后边的逻辑才干拿到一个”至少类型是对的”的值去做进一步判别。

许多前端结构（Ant Design的Form、Element的el-form）自带的validator其实就管到这一层。但光靠这层远远不够。

L3 — 规模边界：合不合理？

格局对了不代表值是合理的。价格不能为负数。库存不能是-500万吨。年度不能填2099年。百分比字段不能呈现200%。

这一层过滤的是”格局正确但事务上离谱”的数据。我管这叫”合法的垃圾”——类型体系认它，事务逻辑不认它。

经常被忽略的一个细节：小数精度也属于这一层。价格保存两位小数，你传进来一个3.14159，后边核算会不会出精度漂移？该在这里就truncate或许round掉。

L4 — 相关逻辑：字段之间自洽吗？

单字段都合法了，但字段之间可能打架。

毛利 = (价格 – 本钱) / 价格。这三个字段之间有硬束缚。用户手动填了毛利和价格，但填的本钱算出来对不上——这便是跨字段逻辑校验该干的活。

还有一类更荫蔽的：条件必填。比如选了某个产品工艺之后，产值单位的可选规模要联动变化。选了”省份”之后，”企业”的下拉列表要跟着过滤。

这一层的本钱比前三层高不少，由于你要同时拿到多个字段的值做交叉判别。所以它排在第四。

L5 — 大局外部：跟体系里已有的数据抵触吗？

最贵的一层。要查库。

同一个”产品 + 企业 + 省份 + 周度时间”的组合，不能重复录入。这个判别必须发恳求到后端，后端去数据库里跑一条select。网络IO + 数据库查询，这是整个校验链路里本钱最高的操作。

所以放在最终。只有前面四层悉数pass了，才值得发这一趟恳求。

你想想，假如把L5放在L1前面会怎样？用户连必填项都没填全，你就发了一次数据库查询。并发高一点，这种无效查询能把你的DB连接池吃得干干净净。

实质便是个短路求值。任何一层挂了，后边不跑。这不是什么高深的规划模式，便是最朴素的本钱排序——选择性高、代价低的条件先履行。

你去看数据库查询优化器选履行计划的逻辑，一模相同的思路。MySQL决定先走哪个索引、先过滤哪个条件，背后也是这套”廉价的先来”。

这套思路不只管表单

你再想远一点。

API接口参数校验，是不是同一套？收到恳求 → 必传参数在不在 → 类型对不对 → 值域合不合理 → 参数间逻辑（start_date < end_date）→ 权限校验（查Redis/查DB）。任何一个老练的API结构，中间件链的排列次序便是按这个来的。

ETL数据清洗，也是。拿到一批CSV → 空行删掉 → 格局一致（日期转ISO、数字去逗号）→ 异常值过滤（价格为负的行剔除）→ 跨字段一致性校验 → 跟主表去重。你要是把去重放在第一步，几百万条数据先全量join一遍，跑到天荒地老。

甚至代码review的时分，你看一个PR，下意识的扫描次序也是：这个改动有没有（L1，别是个空PR）→ 改的对不对地方（L2，文件和模块对不对）→ 改动幅度合不合理（L3，是不是改了不应改的）→ 跟其他模块有没有抵触（L4）→ CI跑过没有（L5，外部验证）。

同一套模型，不同的皮肤。

落地的时分，一张表搞定

回到实际工作。我现在写PRD里的表单需求，直接用一张校验规矩矩阵表跟开发对齐：

比在PRD里写一大段”当用户输入价格时，体系应判别价格是否为空，假如为空则提示……假如不为空则持续判别格局……”清楚十倍。开发拿到这张表，每个字段每一层该干嘛，一望而知，不用反复对齐。

测验搭档也爱这张表。写测验用例的时分，每一层便是一组case。L1的case：每个必填字段分别传空。L2的case：每个字段分别传不合法格局。这么列下来，漏测的概率小许多。

前端校验和后端校验的联系

顺便说一个容易吵架的点。

前端该不应做校验？当然该做。用户体会好，即时反应，不用等网络往复。

但前端校验能不能当安全防地？不能。由于前端校验可以被绕过——随意开个Postman直接打接口，你的前端校验跟没有相同。

所以正确的做法是：前端做L1到L4，体会层面拦一道。后端L1到L5悉数重跑一遍，这是安全兜底。L5本来就要查库，只能在后端做。

别觉得后端重复跑一遍是浪费。安全领域有个原则叫”纵深防护”——不是一道墙够高就行，是多道墙叠在一同，每道都有可能拦住一类攻击。校验也是相同。

有些团队为了省劲，前端做了校验后端就不做了。我只能说，等哪天被人用脚本往你接口里灌脏数据的时分，你就知道这个偷闲有多贵了。

说究竟，校验规划这件事没有什么花活。就一条原则：

先做廉价的判别，再做贵的判别。先用本地信息，再用外部信息。先查格局，再查语义。

把这条刻进DNA里，不管是写表单、规划API、搭数据管道仍是做音讯消费，你的校验逻辑都不会太离谱。

至于那个把查库放在第一步的搭档——他后来重构了。现在那段代码的注释写着：

“L1→L5，别改次序。改了请客。”

上一条：货代SaaS实战：反常办...

下一条：出海北美，需求知道的六件...