Javascript、Tesseract、AWS IoT、Dynamodb 和缓冲区
我正在开发和测试一个小型 Tesseract 项目,并且完全归功于 http://aalvarez.me/blog/posts/building-an-ocr-service-with-tesseractjs-in-aws-lambda.html 我在 Lambda 中运行一个 Tesseract 项目,它接收 s3 事件并处理上传到 s3 的图像。
下一个目标是研究如何处理来自 AWS IoT 的图像。主要障碍是您无法通过 MQTT 发送图像。
我的方法是将图像的缓冲区/二进制流发送到 MQTT 主题,然后 IoT 规则触发相同的 lambda 进行处理。
但首先我需要有一个有效的二进制流(没有真正的硬件和摄像头,仅供参考,我是后端人员)通过 IoT 发送,所以我修改了我的项目,不仅存储对图像执行的 OCR 结果,还存储图像的二进制流/缓冲区。
我需要这样做是因为 AWS Cloudwatch 截断了日志记录,因此当我注销 Lambda 函数加载的 s3 对象的数据有效负载时,您得到的只是一个严重截断的缓冲区对象。
dataBody: <Buffer 89 50 4e 47 0d 0a 1a 0a 00 00 00 0d 49 48 44 52 00 00 01 90 00 00 01 90 08 06 00 00 00 80 bf 36 cc 00 00 20 00 49 44 41 54 78 5e ed 9d 09 f8 76 df 58 ... >
因此,我添加了一些代码,使用 DynamoDB updateItem 和 SET 如下所示,在数据库项上设置一个属性,并使用原始缓冲区执行 OCR按照下面的方法
"UpdateExpression": "SET img = :attrValue",
"ExpressionAttributeValues": {
":attrValue": { "B": dataBody }
这样就成功了,而且在项目中创建了属性,并且该属性具有一大串字符,我认为这些字符是原始的,但是可能格式有所不同
现在,如果我采用那个大字符串并将其作为 MQTT 负载发送并触发规则,那么 Lambda 就会触发,但是当我转换负载并尝试处理它时,Tesseract 会抱怨
TypeError:无法读取 null 的属性“mime”
该错误可能是将 IoT 负载转换为缓冲区进行处理的结果,因为现在它与读取原始 s3 对象时的原始缓冲区完全不同,因此不存在 mime 属性。数据现在被破坏了,我正在挑选
let ocrBuffer = Buffer.from(iotEvent)
ocrBuffer: <Buffer 69 56 42 4f 52 77 30 4b 47 67 6f 41 41 41 41 4e 53 55 68 45 55 67 41 41 41 5a 41 41 41 41 47 51 43 41 59 41 41 41 43 41 76 7a 62 4d 41 41 41 67 41 45 ... >
对于缓冲区和处理图像等,我有点新手,但我怀疑将其存储到 DynamoDB 的过程以某种方式改变了原始缓冲区或将其包装在某个东西中,所以我需要正确地取消更改/解包它,以便它变得与以 89 而不是 69 开头的原始缓冲区相同。
有谁知道哪里出了问题,应该从哪里开始寻找。
现在我可以将图像上传到 s3,我想以某种方式保存有效载荷,以便我可以将其用作通过 IoT 服务使用的测试有效载荷
谢谢 马克
您的问题的关键似乎是来自 Tesseract 的此消息:
TypeError:无法读取 null 的属性“mime”
这至少有一个明确的原因。当您将数据发送到 Tesseract 时,听起来您没有设置 Content-type http 标头。
在 来自 Tesseract 的示例中,Content-type 标头似乎是必需的,这很有意义,因为它需要知道您要向其发布什么类型的文件。
所以我认为这里的问题是您的 Lambda 函数如何将数据发布到 Tesseract,特别是它如何设置 Content-type 和 Content-Disposition 标头?
虽然您的二进制数据可能存在问题,但我现在可能不会关注这一点,因为这似乎不是 Tesseract 所抱怨的事情关于。
您可以尝试使用 curl 将(本地)文件发布到 Tesseract。假设此方法有效,请将 HTTP 请求与您的 Lambda 函数生成的请求进行比较,然后从那里开始反向操作。我怀疑您没有内容问题,或者至少可能不是当前的问题。
已解决
我需要做的就是在使用
Buffer.from(string, 'base64')
转换为缓冲区时指定“base64”