Hello

Create a simple torchscript model:

./code/hello/ex1.py

#!/usr/bin/env python3

import torch


class Foo(torch.nn.Module):
    def forward(self, x):
        return torch.nn.functional.relu(x)


f = Foo()
x = torch.rand(2)
m = torch.jit.trace(f, x)
m.save("ex1.pt")
print(m.graph)

MNNConvert -f TORCH --modelFile ./ex1.pt --MNNModel ex1.mnn --bizCode MNN

It prints:

Start to Convert Other Model Format To MNN Model...
Start to Optimize the MNN Net...
inputTensors : [ x.1, ]
outputTensors: [ 2, ]
Converted Success!

We can use:

netron ex1.mnn --port 6006

to view it:

Serving 'ex1.mnn' at http://localhost:6006

To convert the model to json, use:

MNNDump2Json ./ex1.mnn ./ex1.json

which generates:

./code/hello/ex1.json

{ "bizCode": "MNN", "extraInfo": 
{ "version": "2.1.1" }
, "oplists": 
[ 
{ "main_type": "Input", "main": 
{ "dtype": "DT_FLOAT", "dformat": "NCHW" }
, "name": "x.1", "outputIndexes": 
[ 0 ]
, "type": "Input", "defaultDimentionFormat": "NHWC" }
, 
{ "inputIndexes": 
[ 0 ]
, "main_type": "Relu", "main": 
{ "slope": 0.0 }
, "name": "2", "outputIndexes": 
[ 1 ]
, "type": "ReLU", "defaultDimentionFormat": "NCHW" }
 ]
, "outputName": 
[ "2" ]
, "preferForwardType": "CPU", "sourceType": "TORCH", "tensorName": 
[ "x.1", "2" ]
, "tensorNumber": 0, "usage": "INFERENCE", "mnn_uuid": "d24b26b1-14c8-42cb-9ce1-2a9b867714e9" }

To convert ex1.json back to a .mnn file, use:

MNNRevert2Buffer ex1.json ex11.mnn

To show the information of the model:

MNNConvert --framework MNN --modelFile ./ex1.mnn --info

It prints:

Model default dimensionFormat is NCHW
Model Inputs:
[ x.1 ]: dimensionFormat: NCHW, size: [ ], type is float
Model Outputs:
[ 2 ]
Model Version: 2.1.1

To run it with MNN in Python:

./code/hello/test-ex1-mnn.py

#!/usr/bin/env python3

import numpy as np
import MNN
import torch


def main():
    interpreter = MNN.Interpreter("ex1.mnn")

    config = {}
    config["precision"] = "low"  # low, high, normal
    config["backend"] = "CPU"
    #  config["thread"] = 1
    session = interpreter.createSession(config)

    #  a = torch.tensor([1, -2.5, 3.2], dtype=torch.float32)
    #  b = a.numpy()

    input_tensor = interpreter.getSessionInput(session)
    interpreter.resizeTensor(input_tensor, (3,))
    interpreter.resizeSession(session)
    print("input_tensor.getShape()", input_tensor.getShape())

    input_data = MNN.expr.const(
        np.array([1, -2.5, 3.2], dtype=np.float32),
        (3,),
        MNN.expr.NCHW,
        MNN.expr.float,
    )
    input_tensor.copyFrom(MNN.Tensor(input_data))
    print("input_tensor.getNumpyData()", input_tensor.getNumpyData())

    interpreter.runSession(session)

    output_tensor = interpreter.getSessionOutput(session)
    print("output_tensor.getNumpyData()", output_tensor.getNumpyData())

    output_data = MNN.Tensor(
        output_tensor.getShape(), MNN.Halide_Type_Float, MNN.Tensor_DimensionType_Caffe
    )
    output_tensor.copyToHostTensor(output_data)
    print("output_data.getNumpyData()", output_data.getNumpyData())


if __name__ == "__main__":
    main()

It prints:

input_tensor.getShape() (3,)
input_tensor.getNumpyData() [ 1.  -2.5  3.2]
output_tensor.getNumpyData() [1.  0.  3.2]
output_data.getNumpyData() [1.  0.  3.2]